2025.12.18 (목)

  • 맑음동두천 -0.2℃
  • 맑음강릉 4.1℃
  • 맑음서울 2.8℃
  • 맑음대전 2.8℃
  • 맑음대구 3.4℃
  • 맑음울산 6.9℃
  • 맑음광주 5.9℃
  • 맑음부산 8.0℃
  • 맑음고창 1.4℃
  • 맑음제주 7.9℃
  • 맑음강화 0.7℃
  • 맑음보은 0.5℃
  • 맑음금산 0.2℃
  • 맑음강진군 2.7℃
  • 맑음경주시 2.1℃
  • 맑음거제 4.7℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] “쉽지 않겠네”…50대 머스크의 20대 여배우 파격의상에 AI 이미지 첨부한 댓글 논란

[뉴스스페이스=윤슬 기자] 테슬라 최고경영자 일론 머스크가 최근 할리우드 배우 시드니 스위니(28)의 레드카펫 의상에 대해 SNS에서 ‘쉽지 않겠네(Can’t be easy)’라는 댓글과 함께 인공지능(AI) 생성 이미지를 첨부해 논란이 일고 있다. 12월 17일(현지시간) 미국 연예매체 버라이어티를 비롯해 국내외 언론들은 이 사건을 집중 보도하며, 머스크의 발언이 26세 연하의 젊은 여배우 신체를 농담 소재로 삼은 부적절한 사례라고 지적했다.​ 논란의 발단과 SNS 반응 머스크는 영화 ‘더 하우스메이드’ 시사회에 참석한 스위니의 영상을 자신의 SNS 플랫폼 X(구 트위터)에 공유하며, ‘쉽지 않겠네’라는 짧은 문구와 함께 AI로 생성된 것으로 보이는 이미지를 첨부했다. 해당 이미지에는 척추 통증을 호소하는 인물과 신체 부위가 강조된 여성의 모습이 담겨 있어, 스위니가 신체적 불편함을 겪을 것이라는 우회적 표현이라는 해석이 나왔다. 국내외 누리꾼들은 “50대 기업인이 20대 여배우 신체를 농담거리로 삼는 것은 부적절하다”며 “기괴하다(Weird)”는 반응을 쏟아냈다.​ 문화적·철학적 해석 이번 사건은 단순한 SNS 논란을 넘어, 성별·세대·권력 관계 속에서

[The Numbers] 마이크론, 분기 최대 실적과 가이던스 ‘더블 서프라이즈’…삼성전자·SK하이닉스 ‘마이크론 랠리’ 최대 수혜

[뉴스스페이스=김정영 기자] 미국 메모리 반도체 3위 업체 마이크론 테크놀로지가 2026 회계연도 1분기(2025년 9~11월) 실적에서 매출 136억4000만달러, 조정 EPS 4.78달러를 기록하며 시장 예상(매출 129억5000만달러·EPS 3.95달러)을 큰 폭으로 웃돌았다. 전년 동기와 비교하면 매출은 약 57% 급증하면서 회사 역사상 최대 분기 매출과 함께 모든 사업부에서 의미 있는 마진 확대를 달성했다는 설명이다.​ 마이크론은 이어 2026 회계연도 2분기(2025년 12월~2026년 2월) 매출 가이던스를 183억~191억달러로 제시해, 월가 컨센서스(약 144억달러)를 30% 이상 상회하는 ‘초강력 전망’을 내놨다. 회사 측은 같은 분기 조정 EPS 역시 8달러대 중반 수준까지 상승할 것으로 제시하며, 매출·이익률·EPS·자유현금흐름 모두에서 사상 최대치를 예고했다.​ “AI 필수 인프라 기업” 선언…HBM·데이터센터 메모리에 투자 몰린다 산제이 메흐로트라 마이크론 CEO는 실적 발표에서 “마이크론은 AI를 가능하게 하는 필수적인 핵심 기업”이라고 규정하며, 고객사의 메모리·스토리지 수요 급증에 대응하기 위해 투자를 공격적으로 확대하고 있다고

[빅테크칼럼] 머스크, 트럼프와 결별 후에도 공화당에 140억원 쾌척…'테슬라머니 정치학' 내년 중간선거 흔든다

[뉴스스페이스=이종화 기자] 일론 머스크 테슬라 최고경영자(CEO)가 내년 미국 중간선거를 앞두고 공화당에 정치자금 지원을 재개한 것으로 확인됐다. 미국 정가와 주요 언론에 따르면, 머스크는 2025년 6월 27일 연방 상원과 하원의 공화당 슈퍼팩(특정정치활동위원회)에 각각 500만 달러씩, 총 1000만 달러(약 140억원)를 기부했다. 이는 올해 상반기 미국 슈퍼팩으로 들어간 개인 기부금 중 최고액으로, 머스크가 여전히 미국 정치판에서 막강한 영향력을 행사하고 있음을 보여준다.​ 머스크의 이번 정치자금 지원은 지난해 대선 과정에서 트럼프 대통령과 공화당 후보들을 위해 2억9150만 달러(약 4298억원)를 투입한 데 이어 이어진 후속 행보다. 특히 머스크가 설립한 슈퍼팩 '아메리카팩(America PAC)'은 경합 주 유권자들에게 헌법 청원 서명 시 100달러를 지급하고, 매일 1명씩 100만 달러(약 14억7000만원)를 증정하는 등 독특한 선거운동을 펼쳤다. 이 같은 현금 유도 전략은 경합 주의 선거 결과에 상당한 영향을 미친 것으로 평가받는다.​ 최근 머스크와 트럼프 대통령 사이에는 감세 법안을 둘러싼 갈등이 표면화됐다. 머스크는 트럼프의 감세 법안