반응형
- Word2Vec, GloVe, fastText, RoBERTa, BERT, M-USE으로 문장 임베딩 생성
- 한국어 말뭉치인 네이버 영화 리뷰(NSMC), KorNLI, KorSTS를 각각 활용
- 분류 문제와 문장 유사도 문제를 풀어보고 문장 임베딩 별 성능 확인
- SRoBERTa가 제일 좋은 성능
- 사전 학습 모델이 중요
- task와 미세 조정 유무에 따라 문장 임베딩 모델의 순위가 달라짐
- 최신의 모델을 적용하는 것 X
- 자신의 task에 적합한 모델을 선택하는 것이 중요
반응형
'ML 관련 > 자연어 처리 관련' 카테고리의 다른 글
텍스트 요약(사내 세미나) (0) | 2024.03.05 |
---|---|
NLP(Natural Language Process) - 필수 용어 및 개념 정리(2) (1) | 2024.01.15 |
NLP(Natural Language Process) - 필수 용어 및 개념 정리(1) (0) | 2024.01.15 |
[논문 리뷰] 자기지도학습 기반 음성 언어 모델을 이용한 자소 단위의 한국어 음성 인식 리뷰 (0) | 2023.01.03 |
LSTM (0) | 2021.07.18 |
댓글