SK텔레콤은 7일 국립국어원과 한국어에 적합한 차세대 AI 언어 모델을 개발하는 업무협약을 체결했다고 발표했습니다. 양사는 기존 자연어처리 AI 중 최고로 꼽히는 'GPT-3'(Generative Pre–Training-3)과 비슷한 성능의 한국어 GLM을 구축한다는 계획입니다.
작년에 네이버는 GPT-3을 능가하는 한국어 언어 모델을 만든다는 계획을 발표했습니다.
www.aitimes.kr/news/articleView.html?idxno=17963
언어 모델(Language Model)이란 예를들어 설명하면, 스마트 폰에서 글을 입력할 때 다음 쓸 말을 추천하는 것이라 할 수 있습니다. 만약 '비오는' 이라는 단어를 치면 '날', '날의', '날에도' 같은 단어를 보여주는 것이죠.
언어 모델에 대해서 간략하게 잘 설명한 블로그를 링크합니다.
GPT-3은 오픈AI가 아카이브(arXiv)를 통해 공개했다.
아카이브에 발표된 GPT-3 논문을 설명한 블로그 입니다.
그럼 GPT-3가 뭘까요?
GPT-3은 코딩, 글짓기, 번역 등 다양한 기능을 가진 AI 언어모델로, 일론 머스크 테슬라 창업자 등이 설립한 AI 연구기관 '오픈AI'가 지난해 5월 발표했다. GPT-3은 기존 GPT–2의 개량 모델로 방대한 양의 데이터셋(3000억 개의 토큰)과 매개변수(1750억 개)를 갖춘 자연어 모델 기반의 딥러닝 시스템이다. GPT–3은 기존 AI와 달리 상당히 많은 분야의 질문에 답할 수 있다. 단일 문장이 아니라 대화의 문맥을 파악하고 창의적인 답변을 내놓는 수준에 도달했고 인간이 작성한 뉴스 기사와 구분하기 어려운 수준의 기사를 작성할 수도 있다. GPT-3은 자연스러운 언어 표현이 가능해 일상의 감성 대화, 고객센터 대화뿐 아니라 시사, 문학, 역사, 게임 콘텐츠 등 다양한 영역의 언어 활동에 적용할 수 있다. GPT–3과 대화를 나눠보면 GPT–3은 인류의 어리석음과 사랑에 대해 얘기하고 거짓말도 한다. 이처럼 특정 작업만 수행할 수 있던 AI 수준이 기술의 발전과 함께 다양한 업무 수행이 가능해지고 인간과 흡사한 지적 판단이 가능해지면서 GPT-3과 같은 딥러닝 시스템의 중요성도 대두되고 있다. <출처: news1 뉴스 "네이버 이어 SK텔레콤도 개발 뛰어든 한국어판 'GPT-3'가 뭐길래" 중에서> |
www.news1.kr/articles/?4268650
GPT는 현재 가장 주목 받고 있는 기술인 것은 분명한 것 같습니다.
www.aitimes.kr/news/articleView.html?idxno=17370
하지만 GPT-3은 여러가지 한계도 있다고 합니다. 대표적인 것이 바로 물리학적 상식이 없다는 것 입니다. 가령, 치즈를 냉장고에 넣으면 녹을까요?와 같은 질문에 잘 대답하지 못한다고 합니다. (GPT-3 발표 논문인 "Language Models are Few-Shot Learners"에도 설명되어 있습니다.)
www.aitimes.kr/news/articleView.html?idxno=17455
같이 읽으면 좋은 글:
2021.03.08 - [IT 이야기] - 자연어 처리 시장 2026년 351억 달러 전망
'IT 이야기' 카테고리의 다른 글
삼성전자 CBDC 참여 (0) | 2021.08.05 |
---|---|
디지털화폐(Central Bank Digital Currency: CBDC) (0) | 2021.08.05 |
구글, 전 세계 유튜버 미국 수익분 세금 원천징수 (0) | 2021.03.11 |
자연어 처리 시장 2026년 351억 달러 전망 (0) | 2021.03.08 |
싸이월드 (0) | 2021.02.07 |
댓글