2025.12.20 (토)

  • 흐림동두천 8.3℃
  • 구름많음강릉 12.0℃
  • 서울 8.8℃
  • 흐림대전 8.3℃
  • 박무대구 4.1℃
  • 구름많음울산 11.7℃
  • 흐림광주 10.1℃
  • 흐림부산 15.5℃
  • 흐림고창 13.5℃
  • 제주 18.5℃
  • 흐림강화 9.8℃
  • 흐림보은 3.8℃
  • 흐림금산 5.2℃
  • 흐림강진군 8.7℃
  • 구름많음경주시 6.5℃
  • 흐림거제 10.7℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 엡스타인 사진 추가 공개…빌 게이츠·브린·우디 앨런 등 정·재·학계 거물들 연이어 '등장'

[뉴스스페이스=윤슬 기자] 미국 연방 하원 감독위원회가 최근 9만5000장에 달하는 제프리 엡스타인의 사진 중 일부를 추가로 공개하면서, 빌 게이츠, 구글 공동 창업자 세르게이 브린, 영화감독 우디 앨런, 노엄 촘스키 등 세계적으로 유명한 인물들이 엡스타인과의 교류를 드러내는 사진이 연이어 등장했다. BBC News​, PEOPLE​, The Guardian​, Forbes​, ABC News​에 따르면, 이번 공개는 2025년 12월 18일(현지시간) 하원 민주당 소속 의원들이 진행한 것으로, 공개된 사진 중에는 빌 게이츠가 신원 미상의 여성과 함께 포즈를 취한 모습, 촘스키가 엡스타인과 대화를 나누는 장면, 브린과 앨런, 데이비드 브룩스, 에후드 바라크 등이 엡스타인의 자택이나 관련 장소에서 촬영된 모습이 포함됐다. ​ 공개된 사진의 구체적 내용 공개된 사진들은 대부분 무기명 처리된 여성의 신체 일부와, 러시아 문호 블라디미르 나보코프의 소설 '롤리타'의 문구가 적힌 발 사진 등도 포함돼 논란을 키우고 있다. 이 사진들은 엡스타인의 자택과 사생활 공간에서 촬영된 것으로, 일부는 그의 개인 항공기 내부와 뉴욕, 캐러비안 제도 등지에서 촬영된 것으로 알려졌다

[빅테크칼럼] AI의 아버지, 샘 올트먼의 딥페이크 다큐 ‘강제 데뷔’…AI로 만든 ‘샘봇’ 내년 1월 북미 개봉

[뉴스스페이스=김정영 기자] 샘 올트먼 오픈AI CEO가 본인의 동의 없이 AI 기술로 만들어진 딥페이크 다큐멘터리에 강제로 등장하게 된 사건이 전 세계적으로 큰 파장을 일으키고 있다. 미국의 다큐멘터리 감독 애덤 발라 로프는 샘 올트먼의 인터뷰를 수십 차례 요청했으나 100일간 응답이 없었고, 오픈AI 사옥 방문 시에도 보안요원에 의해 퇴출되는 등 직접 인터뷰는 불가능했다. 이에 로프 감독은 인도로 날아가 현지 연기자와 엔지니어들과 협업해 AI로 올트먼의 디지털 복제본인 ‘샘봇’을 제작, 영화 ‘딥페이킹 샘 올트먼’을 내년 1월 북미에서 개봉할 예정이다.​ 딥페이크 다큐 제작 과정과 기술적 진화 로프 감독은 올트먼의 인터뷰, 강연, 공개 영상 등 수많은 자료를 수집해 AI 학습에 활용하려 했지만, 미국 내에서는 법적·윤리적 문제로 인해 제작이 어려웠다. 실리콘밸리에서는 AI 딥페이크 제작에 대한 경계심이 높고, 소송 우려로 인해 아무도 협조하지 않았다는 설명이다. 결국 인도로 이동해 ‘샘봇’을 완성했는데, AI 딥페이크 제작 과정은 인물의 영상·사진을 4천여 장 이상 수집해 일주일 동안 약 100만 회 이상의 AI 학습을 거쳐 정교한 합성 영상을 만드는 방

[이슈&논란] “쉽지 않겠네”…50대 머스크의 20대 여배우 파격의상에 AI 이미지 첨부한 댓글 논란

[뉴스스페이스=윤슬 기자] 테슬라 최고경영자 일론 머스크가 최근 할리우드 배우 시드니 스위니(28)의 레드카펫 의상에 대해 SNS에서 ‘쉽지 않겠네(Can’t be easy)’라는 댓글과 함께 인공지능(AI) 생성 이미지를 첨부해 논란이 일고 있다. 12월 17일(현지시간) 미국 연예매체 버라이어티를 비롯해 국내외 언론들은 이 사건을 집중 보도하며, 머스크의 발언이 26세 연하의 젊은 여배우 신체를 농담 소재로 삼은 부적절한 사례라고 지적했다.​ 논란의 발단과 SNS 반응 머스크는 영화 ‘더 하우스메이드’ 시사회에 참석한 스위니의 영상을 자신의 SNS 플랫폼 X(구 트위터)에 공유하며, ‘쉽지 않겠네’라는 짧은 문구와 함께 AI로 생성된 것으로 보이는 이미지를 첨부했다. 해당 이미지에는 척추 통증을 호소하는 인물과 신체 부위가 강조된 여성의 모습이 담겨 있어, 스위니가 신체적 불편함을 겪을 것이라는 우회적 표현이라는 해석이 나왔다. 국내외 누리꾼들은 “50대 기업인이 20대 여배우 신체를 농담거리로 삼는 것은 부적절하다”며 “기괴하다(Weird)”는 반응을 쏟아냈다.​ 문화적·철학적 해석 이번 사건은 단순한 SNS 논란을 넘어, 성별·세대·권력 관계 속에서