이전 버전의 챗GPT는 4,096개의 토큰으로 약 8,000 단어 또는 책 한 권의 4~5페이지에 해당하는 한계에서 GPT-4의 최대 토큰 수는 32,768개로 약 64,000단어 또는 50페이지의 희곡 또는 단편 소설을 쓰는 것에 충분...

이미지:본지
이미지:본지

"GPT-4는 GPT-3.5보다 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 82% 적고 사실에 입각한 응답을 할 가능성이 40% 더 높다"

오픈AI가 14일(현지시간) GPT-4를 전격 공개했다. 고급 추론(reasoning) 기능으로 폭넓은 일반 지식과 문제 해결 능력 덕분에 어려운 문제를 더 정확하게 풀 수 있다. 이를 통해 지난 몇 달 동안 폭발적인 인기를 끌었던 챗GPT(ChatGPT)는 GPT-3.5와 상호작용하는 방식이었으나 이제는 GPT-4와 상호작용하는 방식이 된 것이다.

GPT-4는 월 20달러를 지불하는 유료 서비스인 챗GPT플러스(ChatGPT Plus)에서 사용할 수 있으며 개발자를 위한 API와 무료 데모도 곧 제공될 예정이다.

이날 오픈AI는 GPT-4와 함께 AI 모델의 성능을 평가하기 위한 소프트웨어 프레임워크 에벌즈(Evals)를 오픈소스로 공개했다. 이 도구를 통해 누구나 모델의 문제와 단점을 제시하여 모델을 개선할 수 있다.

오픈AI는 GPT-4는 챗GPT의 약 8배인 최대 25,000단어까지 처리할 수 있으며, 안전과 정치적으로 편향되거나 극단적으로 공격적이거나 때에 따라 서로 다른 방식의 결과, 거짓말 등의 최근 이슈를 인정하고 이를 보완하기 위해 6개월을 보냈고 그동안의 피드백에 대해 학습(수많은 악성 프롬프트)했다고 밝혔다.

그러나, 이날 오픈AI 샘 알트만(Sam Altman) CEO는 트위터를 통해 “가장 성능이 뛰어나고 잘 정돈된 모델이지만 이 역시 여전히 잘못된 정보를 공유하는 경향이 있을 수 있다"고 경고했다.(GPT-4 논문 Technical Report 다운)

현재, 인공지능 세계는 영어 사용자가 지배하고 있다. 데이터에서 테스트, 연구 논문에 이르기까지 거의 모든 것이 영어로 되어 있다. 그러나 물론 대규모 언어 모델(LLM)의 기능은 모든 서면 언어에 적용 가능하며, 해당 언어에서 사용할 수 있어야 한다.

여러 언어에 걸친 MMLU의 GPT-4 3-샷 정확도(Azure Translate를 사용하여 57개 주제에 걸친 14,000개의 객관식 문제 모음인 MMLU 벤치마크를 다양한 언어로 번역. 테스트한 26개 언어 중 24개 언어에서 GPT-4는 라트비아어, 웨일스어, 스와힐리어와 같은 리소스가 적은 언어를 포함하여 GPT-3.5 및 기타 LLM(Chinchilla, PaLM)의 영어 성능을 능가
여러 언어에 걸친 MMLU의 GPT-4 3-샷 정확도(Azure Translate를 사용하여 57개 주제에 걸친 14,000개의 객관식 문제 모음인 MMLU 벤치마크를 다양한 언어로 번역. 테스트한 26개 언어 중 24개 언어에서 GPT-4는 라트비아어, 웨일스어, 스와힐리어와 같은 리소스가 적은 언어를 포함하여 GPT-3.5 및 기타 LLM(Chinchilla, PaLM)의 영어 성능을 능가

이에 GPT-4의 다국어 기능은 한국어부터 이탈리아어, 우크라이나어에 이르기까지 26개 언어에 걸쳐 수천 개의 객관식 질문에 높은 정확도로 답변할 수 있음을 보여줌으로써 AI 민주화를 위한 한 걸음을 내디뎠다.

그 중에서도 가장 눈에 띄는 변화는 '멀티모달(Multimodal)'로 이전의 챗GPT 및 GPT-3는 텍스트로 제한되었지만 GPT-4는 이미지를 보고 이해하고 설명하고 요청한 사항을 처리한다. 예를 들어, 재료 사진에서 레시피 제안을 제공하고 캡션 및 설명을 작성할 수 있으며, 더 중요한 것은 라벨을 번역하고, 지도를 읽는 등 다양한 분야에서 이해도가 그 이상이라고 한다.

이러한 대규모 언어 모델은 수백만 개의 웹 페이지, 책 및 기타 텍스트 데이터로 학습되지만 실제로 사용자와 대화할 때 '기억'할 수 있는 양에는 한계가 있다. GPT-3.5와 이전 버전의 챗GPT의 제한은 4,096개의 토큰(컴퓨터가 이해하는 언어단위)이었다. 이는 약 8,000단어 또는 책 한 권의 4~5페이지에 해당하는 한계에 부딪혔다. GPT-4의 최대 토큰 수는 32,768개다. 이는 약 64,000단어 또는 50페이지의 텍스트로 변환된다. 희곡 또는 단편 소설을 쓰는 것에 충분한 것이다.

즉, 대화하거나 텍스트를 작성할 때 최대 50페이지 정도를 기억할 수 있다는 뜻이다. 따라서 20페이지 분량의 대화 내용을 기억하거나, 이야기나 에세이를 작성할 때 35페이지 전에 발생한 사건을 언급할 수도 있다.

마지막으로 오픈AI는 GPT-4는 '성격'을 가지고 있다고 밝혔다. 조향성(Steerability, 통제 가능 정도)은 필요에 따라 행동을 바꿀 수 있는 능력을 가리키는 AI의 흥미로운 개념이다. 이는 동정적인 경청자 역할을 맡는 것과 같이 유용할 수도 있고, 사람들이 모델이 악하거나 우울하다고 확신할 때와 같이 위험할 수도 있다.

GPT-4는 GPT-3.5보다 더 기본적으로 조향 기능을 통합하고 있으며, 사용자는 고정된 장황함, 어조, 스타일을 가진 고전적인 챗GPT 성격을 자신의 필요에 더 적합한 것으로 변경할 수 있게 된다. 특히, 개발팀은 "범위 내에서"라고 말하며, 이것이 모델의 성격을 바꿀 수 있는 가장 쉬운 방법이라고 밝혔다.(아래는 14일 진행된 GPT-4 개발자 라이브스트림)

 

저작권자 © 인공지능신문 무단전재 및 재배포 금지