이 글은 업스테이지 블로그의 "Data-Centric AI 관점으로 재해석하는 자연언어처리 기반 History of AI (https://www.upstage.ai/blog/tech/reinterpreting-the-history-of-nlp-based-ai-through-a-data-centric-perspective) 게시물을 참고하여 작성하였습니다. 자연어처리(NLP)란? 인간의 언어를 컴퓨터가 처리하는 것. 형태소 분석, 질의응답, 대화 시스템 등에 활용된다. 언어 모델은 사람이 읽고 쓰는 문자(Characters)를 컴퓨터가 읽고 쓸 수 있는 Numbers로 표현하고자 함. One-hot encoding 0과 1로 단어를 표현함. 단어들 간의 관계성을 고려할 수 없음. 단어 집합의 크기만큼 벡터..