2025.12.30 (화)

  • 구름많음동두천 -0.9℃
  • 맑음강릉 2.3℃
  • 맑음서울 -0.5℃
  • 맑음대전 -1.0℃
  • 맑음대구 2.3℃
  • 맑음울산 2.0℃
  • 맑음광주 2.7℃
  • 맑음부산 4.3℃
  • 맑음고창 -0.9℃
  • 맑음제주 6.5℃
  • 구름많음강화 -0.6℃
  • 맑음보은 -2.6℃
  • 맑음금산 -1.9℃
  • 맑음강진군 2.6℃
  • 맑음경주시 -0.8℃
  • 맑음거제 3.0℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 챗GPT 미인으로 꼬시고 머스크로 속였다…캄보디아 19억 '로맨틱 피싱 조직' 적발

[뉴스스페이스=윤슬 기자] 캄보디아 포이펫 지역을 거점으로 로맨스 스캠과 가짜 스페이스X 투자 사기를 결합해 약 19억3000만원을 편취한 보이스피싱 조직이 서울동부지검 보이스피싱 범죄 정부합동수사단에 적발됐다. 중국인 총책 지휘 아래 한국인 조직원 20명이 활동한 이 단체는 13명을 기소했으며, 이 중 11명이 구속 상태로 재판에 넘겨졌다. 치밀한 '하이브리드' 사기 수법 조직원들은 챗GPT를 활용해 재력 있는 젊은 여성으로 위장, 피해자들에게 접근해 환심을 산 뒤 일론 머스크의 스페이스X 투자로 '대박 수익'을 약속하며 가짜 앱 설치와 투자금을 유인했다. 피해자 신뢰를 쌓기 위해 가상 신상정보, 사진, 대화 대본을 미리 준비하고, 상담팀을 '채터'(메신저)와 '텔레마케터'(전화)로 분담 운영했다. 범죄수익은 달러나 테더코인(USDT)으로 지급받아 원화로 환전, 철저히 분배했다. ​ 포이펫 '태자단지'의 어두운 실체 캄보디아-태국 국경 포이펫의 철조망 둘러싸인 '태자단지' 콜센터에서 활동한 이 조직은 지난해 12월부터 올해 10월까지 19억3000만원 규모 피해를 냈다. 유사 캄보디아 사기단은 로맨스 스캠으로만 16억원(36명 피해, 최대 2억1000만원)

[CEO혜윰] 25년 빅테크 거물은 머스크 아니다?…AI·미디어 제국 건설한 '은밀한 거인'은 누구?

[뉴스스페이스=이종화 기자] 래리 엘리슨 오라클 창업자 겸 회장이 2025년 미국 기술업계에서 가장 두드러진 거물로 부상하며 일론 머스크를 제쳤다는 평가를 받았다. 블룸버그는 현지시간 12월 26일 "2025년을 정의한 기술 거물"로 81세 엘리슨을 선정하며, 그의 영향력이 AI 인프라부터 미디어 인수전까지 미국 비즈니스 현장을 장악했다고 분석했다. 머스크가 트럼프 행정부 정부효율부(DOGE) 수장직에서 3개월 만에 물러난 후 영향력이 줄어든 틈을 타 엘리슨이 전방위적 행보로 스포트라이트를 독차지했다. ​ 스타게이트 AI 프로젝트로 백악관 데뷔 트럼프 대통령 취임 다음 날인 2025년 1월 21일, 엘리슨은 샘 올트먼 오픈AI CEO, 손정의 소프트뱅크 회장과 함께 백악관에서 5,000억 달러(약 723조원) 규모의 AI 인프라 구축 계획 '스타게이트'를 발표했다. 이 프로젝트는 미국 전역에 데이터센터 네트워크를 구축해 AI 개발을 가속화하며, 초기 1,000억 달러 투자로 텍사스에 첫 데이터센터를 착공할 예정이다. 스타게이트는 오픈AI, 오라클, 소프트뱅크의 합작으로 10만개 이상의 일자리를 창출할 전망이며, 트럼프 행정부의 AI 패권 전략 핵심 축으로 자