hinykorea
타운뉴스

 “진화한 GPT-4, 美변호사 시험 보면 상위 10%권 합격”

 음성인식 비서류  제치고 AI 시장서 급부상 
“오답 주장 등 아직은 완벽하지 않아”

그동안  인공지능(AI) 시장을 주도하던 애플 시리, 구글 어시스턴트 같은 음석인식 비서 (AI 서비스)가 챗GPT 같은 대화형 AI에 밀려나고 있다고 미국 뉴욕타임스(NYT)가  보도했다.

NYT는  15일자 기사에서  특히 2011년 애플이 5세대 아이폰에 탑재해 공개한 시리는 이후 괄목할 만한 기술 발전을 이루지 못한   반면 최근  세계적으로 주목 받는 챗GPT를 비롯한 생성형 AI는 신속한 발전을 이뤄  소프트웨어 코딩, 소설 쓰기 같은 작업도 처리할 수 했다고 분석했다.

존 버키 전 애플 엔지니어는 “시리는 기본 기능 업데이트에만도 몇 주가 걸리는 등 기술적 장애에 부딪혔다”고 NYT에 말했다.  새로운 문구 추가 같은 단순 업데이트는 최장 6주, 새로운 검색 도구 추가 같은 복잡한 기능 업데이트에는 1년이 걸릴 수 있다는 얘기다.   이 때문에 음성인식 비서는 날씨 조회나 알람 같이 수익을 낼 수 없는 분야에만 사용됐다. 반면 세계적으로 주목 받는 챗GPT를 비롯한 생성형 AI는 소프트웨어 코딩, 소설 쓰기 같은 작업도 처리할 수 있다. 사티아 나델라 마이크로소프트(MS) 최고경영자(CEO)는 최근 파이낸셜타임스(FT)에 “음성인식 비서는 멍청하다”고 잘라 말했다.

다만 전문가들은 생성형 AI와 음성인식 기술이 합쳐져 음성으로 제어할 수 있는 기술이 개발될 수 있다고 전망한다.

이런 가운데   세계적 열풍을 일으키고 있는 대화형 인공지능(AI) 챗봇 챗GPT 개발사 오픈AI가 14일  새로운 다중 모달(Multimodal) 방식 대규모 언어 모델(LLM) AI GPT-4를 전격 공개했다. GPT-4는 현재 챗GPT에 적용된 GPT-3.5의 업그레이드 버전이다. 오픈AI는 GPT-4를 적용한 챗GPT를 유료 서비스 챗GPT플러스에서 우선 공개한다고 밝혔다. 마이크로소프트(MS)는 자사 검색엔진 ‘빙’에 이미 탑재했다고 밝혔다.

오픈AI가 이날 자사 홈페이지에서 공개한 GPT-4의 가장 큰 특징은 이미지를 인식하고 해석할 수 있다는 점이다. 텍스트만 입력할 수 있었던 기존 GPT 3.5와 달리 GPT-4는 사용자가 이미지를 활용해 질문할 수도 있다. 다만 결과물(답변)은 기존과 마찬가지로 텍스트로만 출력할 수 있다.

미국 뉴욕타임스(NYT)에 따르면 우유, 요거트 같은 음식물이 들어 있는 냉장고 사진과 함께 ‘어떤 메뉴를 만들 수 있는지’라고 묻자 사진 속 각종 식재료를 인식한 GPT-4는 만들 수 있는 두 가지 메뉴를 추천했다.

전문적 지식 및 추론 능력에서도 GPT-4는 “인간 수준 능력”을 갖췄다고 오픈AI는 설명했다. 기존 GPT-3.5가 미국 모의 변호사 시험에서 하위 10%에 해당하는 성적을 기록한 반면 GPT-4는 어떤 구체적 훈련 없이도 상위 10% 성적을 냈다. 미 대학수학능력시험(SAT) 읽기 및 쓰기 시험과 수학 시험에서도 성적이 가장 높은 사람을 100으로 할 때 GPT-4는 각각 백분위 93과 89를 기록했다.

언어 처리 능력도 향상됐다. GPT-3.5가 사용자의 질문에 대답할 때 최다 4096토큰(약 8000단어) 분량을 기억할 수 있었다면 GPT-4는 그 8배인 3만2768토큰(약 6만4000단어)까지 기억할 수 있다. 약 50페이지 분량의 대화 내용을 머릿속에 넣고 사용자 질문에 더 적합한 대답을 끌어내는 셈이다. 영어 이외 언어도 더 자연스럽게 사용할 수 있게 됐다. 오픈AI 측은 GPT-4가 한국어를 포함한 26개 비영어권 언어 사용에서 70% 이상의 정확도를 보였다고 설명했다.

개발사나 사용을 규제한 콘텐츠를 우회해서 내놓는 이른바 ‘탈옥(jailbreak)’이나 비윤리적 발언을 하며 폭주하는 문제도 일부 수정됐다. 오픈AI는 GPT-4가 허용되지 않은 콘텐츠 요청에 응답할 가능성이 GPT-3.5 대비 82% 줄었다고 밝혔다. 사실을 기반으로 대답하는 비율도 기존 대비 40% 가까이 올랐다.

다만 오픈AI는 GPT-4를 바로 실무에 사용할 수 있긴 해도 만능은 아니라고 강조했다. 답을 지어내거나 오답을 옳다고 주장하는 문제가 여전히 남아 있다는 것이다. 오픈AI는 “새 소프트웨어는 아직 완벽하지 않으며 많은 시나리오에서 인간보다 능력이 떨어진다”며 “여전히 해결하기 위해 노력해야 할 한계가 많다”고 전했다.

Related posts

한인 셰프 , 요식업 오스카 ‘제임스비어드 상’ 수상

안지영 기자

“서류미비 학생, 장학금 신청하세요”

안지영 기자

노스캐롤라이나 사전투표 6일 시작…주별 절차·일정 제각각

안지영 기자