본문 바로가기
IT 이야기

GPT-3? LM? 뭐죠?

by 까삼스 이삐 2021. 4. 9.
728x90
반응형

SK텔레콤은 7일 국립국어원과 한국어에 적합한 차세대 AI 언어 모델을 개발하는 업무협약을 체결했다고 발표했습니다. 양사는 기존 자연어처리 AI 중 최고로 꼽히는 'GPT-3'(Generative Pre–Training-3)과 비슷한 성능의 한국어 GLM을 구축한다는 계획입니다.

 

https://www.news1.kr/articles/?4268650

 

작년에 네이버는 GPT-3을 능가하는 한국어 언어 모델을 만든다는 계획을 발표했습니다.

www.aitimes.kr/news/articleView.html?idxno=17963

 

네이버, GPT-3 능가할 한국어, 일본어 초거대 인공지능 언어 모델 만든다 - 인공지능신문

네이버가 인공지능(AI) 기술 경쟁력 향상에 박차를 가하고 있다. 네이버는 AI연구조직을 확대해 별도 선행 기술연구로 ‘네이버 AI LAB’을 개설한데 이어 국내 기업 최초로 수퍼 컴퓨터를 구축하

www.aitimes.kr

언어 모델(Language Model)이란 예를들어 설명하면, 스마트 폰에서 글을 입력할 때 다음 쓸 말을 추천하는 것이라 할 수 있습니다. 만약 '비오는' 이라는 단어를 치면 '날', '날의', '날에도' 같은 단어를 보여주는 것이죠. 

언어 모델에 대해서 간략하게 잘 설명한 블로그를 링크합니다.

settlelib.tistory.com/51

 

언어 모델(Language Model)

1. 언어 모델(Language Model, LM) - 언어 모델(Language Model)은 언어라는 현상을 모델링 하고자 단어 시퀀스(또는 문장)에 확률을 할당하는 모델이다. - 언어 모델(Language Model,LM)이란 단어 시퀀스(문장)에.

settlelib.tistory.com

GPT-3은 오픈AI가 아카이브(arXiv)를 통해 공개했다.

arxiv.org/abs/2005.14165

 

Language Models are Few-Shot Learners

Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fi

arxiv.org

아카이브에 발표된 GPT-3 논문을 설명한 블로그 입니다.

ai4nlp.tistory.com/11

 

GPT-3 paper를 읽고 써보는 간략한 리뷰 혹은 설명, Language Models are Few-Shot Learners

이번에 OpenAI에서 발표한 Language Models are Few-Shot Learners, 통칭 GPT-3 Paper를 읽어보았다. 논문이 상당히 길어서 읽기 힘들까 걱정되었지만, 기술적인 내용보다는 모델에 대한 insight에 대해 많이..

ai4nlp.tistory.com

 

그럼 GPT-3가 뭘까요?

GPT-3은 코딩, 글짓기, 번역 등 다양한 기능을 가진 AI 언어모델로, 일론 머스크 테슬라 창업자 등이 설립한 AI 연구기관 '오픈AI'가 지난해 5월 발표했다. GPT-3은 기존 GPT–2의 개량 모델로 방대한 양의 데이터셋(3000억 개의 토큰)과 매개변수(1750억 개)를 갖춘 자연어 모델 기반의 딥러닝 시스템이다.

GPT–3은 기존 AI와 달리 상당히 많은 분야의 질문에 답할 수 있다. 단일 문장이 아니라 대화의 문맥을 파악하고 창의적인 답변을 내놓는 수준에 도달했고 인간이 작성한 뉴스 기사와 구분하기 어려운 수준의 기사를 작성할 수도 있다.

GPT-3은 자연스러운 언어 표현이 가능해 일상의 감성 대화, 고객센터 대화뿐 아니라 시사, 문학, 역사, 게임 콘텐츠 등 다양한 영역의 언어 활동에 적용할 수 있다. GPT–3과 대화를 나눠보면 GPT–3은 인류의 어리석음과 사랑에 대해 얘기하고 거짓말도 한다.

이처럼 특정 작업만 수행할 수 있던 AI 수준이 기술의 발전과 함께 다양한 업무 수행이 가능해지고 인간과 흡사한 지적 판단이 가능해지면서 GPT-3과 같은 딥러닝 시스템의 중요성도 대두되고 있다. 

<출처: news1 뉴스 "네이버 이어 SK텔레콤도 개발 뛰어든 한국어판 'GPT-3'가 뭐길래" 중에서>

www.news1.kr/articles/?4268650

 

네이버 이어 SK텔레콤도 개발 뛰어든 한국어판 'GPT-3'가 뭐길래

사실 앞에 겸손한 민영 종합 뉴스통신사 뉴스1

www.news1.kr

 

GPT는 현재 가장 주목 받고 있는 기술인 것은 분명한 것 같습니다.

www.aitimes.kr/news/articleView.html?idxno=17370

 

GPT-3, 인류 역사상 가장 뛰어난 '언어 인공지능'이다 - 인공지능신문

필자 김종윤은 현재, 스캐터랩 코파운더 및 대표이사로 2013년 카카오톡 대화를 통한 감정분석 ‘텍스트앳’ 출시, 2015년 커플 메신저 비트윈과의 협업으로 사랑을 이해하는 인공지능 ‘진저’

www.aitimes.kr

 

하지만 GPT-3은 여러가지 한계도 있다고 합니다. 대표적인 것이 바로 물리학적 상식이 없다는 것 입니다. 가령, 치즈를 냉장고에 넣으면 녹을까요?와 같은 질문에 잘 대답하지 못한다고 합니다. (GPT-3 발표 논문인 "Language Models are Few-Shot Learners"에도 설명되어 있습니다.) 

 

www.aitimes.kr/news/articleView.html?idxno=17455

 

GPT-3... 휼륭하지만 '다섯 가지' 한계를 짚어본다 - 인공지능신문

OpenAI의 3세대 GPT-3(Generation Pre-traination Transformer)는 최근 AI 커뮤니티에 단연 최고의 이슈이다. 많은 전문가들은 텍스트와 심지어 코드까지 작성하는 직관적인 능력을 갖추고 있다고 찬사를 아끼

www.aitimes.kr

 

같이 읽으면 좋은 :

2021.03.08 - [IT 이야기] - 자연어 처리 시장 2026년 351억 달러 전망

 

자연어 처리 시장 2026년 351억 달러 전망

마켓앤마켓이 '2026년까지 전 세계 자연어 처리 시장 전망 (Natural Language Processing Market - Global Forecast to 2026)' 보고서를 발표했습니다. 전 세계 자연어 처리 시장 규모가 2020년 116억 달러..

kka3seb.tistory.com

 

728x90
반응형

댓글