2025.11.14 (금)

  • 맑음동두천 13.5℃
  • 맑음강릉 15.3℃
  • 맑음서울 13.5℃
  • 맑음대전 14.6℃
  • 맑음대구 16.5℃
  • 맑음울산 17.0℃
  • 맑음광주 15.4℃
  • 맑음부산 18.4℃
  • 맑음고창 14.6℃
  • 맑음제주 17.4℃
  • 맑음강화 12.7℃
  • 맑음보은 13.7℃
  • 맑음금산 14.3℃
  • 맑음강진군 16.4℃
  • 맑음경주시 17.7℃
  • 맑음거제 15.8℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[CEO혜윰] 페북 창립자 저커버그, UFC 케이지 입성 초읽기?… “컴퓨터 괴짜? 현실은 선수급 파이터” 데이나 화이트 극찬

[뉴스스페이스=이종화 기자] 메타(Meta) CEO이자 페이스북(Facebook) 창립자인 마크 저커버그의 격투기 실력이 최근 다시 화제다. 미국 UFC 대표 데이나 화이트가 저커버그의 수준을 공식적으로 인정한 데 이어, 저커버그의 실제 훈련·시합 경력과 다양한 세계 정상급 파이터들과의 교류 사실이 국내외 여러 매체를 통해 구체적으로 확인되고 있다.​ 저커버그, "모두를 박살낼 파이터"로 변신 2025년 11월 12일자 영국 데일리 메일과 미국 팟캐스트 '더 스키니 컨피덴셜'에 출연한 데이나 화이트는 "저커버그는 MMA(종합격투기)와 서핑 등 다양한 스포츠를 하고 있으며, 직접 상대를 때려눕힐 수 있을 만큼 실전 실력자"라고 극찬했다. 특히 저커버그를 '컴퓨터 괴짜'로만 보는 인터넷의 시선을 "완전히 현실과 다르다"며 "그를 비웃는 사람들은 모두 박살날 것"이라고 언급했다. 저커버그의 실전 격투기 능력을 UFC 대표가 직접 보증한 것이라 더욱 화제다.​ 실전 기록과 기술은 "선수급" 저커버그의 격투기 행적은 단순한 취미 수준이 아니다. 2020년 무렵 본격적으로 MMA와 브라질리언 주짓수(BJJ) 트레이닝을 시작한 그는 2023년 미국 캘리포니아 대회에 첫

[빅테크칼럼] 올트먼 "개인화된 AI가 새로운 보안 위험을 초래한다" 경고

[뉴스스페이스=김정영 기자] 오픈AI의 최고경영자(CEO) 샘 올트먼이 최근 스탠퍼드 대학에서 진행된 인터뷰에서 AI 개인화가 심화됨에 따라 새롭게 대두되는 보안 위험에 대해 경고했다. 점차 사용자 개개인의 데이터를 학습해 맞춤형 서비스를 제공하는 AI 기술이 민감한 개인정보 유출 가능성을 높이고 있으며, 이는 AI 분야의 다음 발전 단계에서 가장 중대한 보안 과제가 될 것이라고 설명했다.​ 올트먼은 특히 사용자가 AI와의 대화 기록, 연결된 외부 서비스(이메일, 쇼핑 등)를 통해 AI가 개인 생활을 폭넓게 ‘기억’하게 되는 점을 지적했다. 이러한 개인화 기능은 사용자 경험을 개선하지만, 동시에 모델이 개인의 프라이버시 정보를 해킹이나 데이터 탈취 공격에 노출될 위험도 커진다고 경고했다. 예를 들어, AI 비서가 이전 대화에서 수집한 의료 정보를 온라인 구매 과정에서 무심코 노출할 수 있다는 것이다. 올트먼은 “사람은 맥락을 이해하지만 AI는 사적인 정보와 일반적인 맥락을 구분하기 어렵다”며, “개인 모델에서 모든 것을 알고 있는 정보를 빼내가는 데이터 유출을 완벽히 방지하는 것은 AI 보안에서 가장 어려운 목표 중 하나”라고 말했다.​ 더욱이, AI 시스템

[빅테크칼럼] "중국 AI 모델이 글로벌 표준이 될 수 있다" 에릭 슈미트 前 구글 CEO 경고…"우수성 아닌 무료 때문"

[뉴스스페이스=이종화 기자] 에릭 슈미트 전 구글 CEO가 최근 공개한 팟캐스트 인터뷰에서 중국의 오픈소스 AI 모델들이 우수한 품질 때문이 아닌 비용 부담이 적기 때문에 전 세계에서 표준이 될 가능성이 크다고 경고했다. 그는 특히 서방 국가들이 주로 폐쇄형(closed-source) AI 모델에 투자하는 반면, 중국은 장대한 오픈소스 AI 생태계를 구축해 많은 국가들이 무료로 접근할 수 있다고 지적했다. 타임스오브인디아, 비즈니스인사이더, 마켓코리아, 블룸버그, SCMP에 따르면, 슈미트는 “미국과 서구권은 대형 AI 모델을 폐쇄형으로 운영하며 상당한 비용이 든다. 반면 중국은 최대 AI 모델을 오픈소스로 공급하며 이들은 무료다. 자금력이 부족한 다수 국가들은 품질이 아닌 가격 때문에 중국 모델을 채택할 수밖에 없다”고 말했다.​ 다운로드 수로 드러난 중국 AI 생태계 성장 중국 알리바바의 대표 AI 모델인 Qwen 시리즈는 개발자 플랫폼 허깅페이스(Hugging Face)에서 올해 누적 다운로드 3억8530만건을 기록하며 메타의 Llama(3억4620만건)를 앞섰다. 현재 허깅페이스에서 중국산 파생 언어모델이 전체 신규 모델의 40% 이상을 차지하며, 메

[빅테크칼럼] AI 투자 열풍에 빅테크, 사상 최대 930억 달러 채권 발행…"인프라 붐과 시장 불안 동반"

[뉴스스페이스=윤슬 기자] 올해 아마존, 알파벳, 메타, 마이크로소프트, 오라클 등 다섯 대형 빅테크 기업이 총 930억 달러 규모의 회사채를 발행해, 지난 3년간 채권 발행액을 단숨에 뛰어넘는 기록을 세웠다. 뱅크 오브 아메리카, 무디스, JP모건, 블룸버그에 따르면, 이는 인공지능(AI) 및 데이터 센터 인프라 구축에 대한 투자 확대에 따른 것으로, 자본 조달을 위한 채권 발행이 채권시장에 상당한 영향을 미치고 있다. 특히 메타가 10월 말 300억 달러의 회사채를 발행하며 올해 미국에서 가장 큰 고등급 회사채 발행 기록을 세웠고, 알파벳은 11월 초 미국과 유럽 시장에서 총 250억 달러를 조달했다. 오라클 역시 9월에 180억 달러 규모의 채권을 발행해 AI 인프라 구축과 데이터 센터 프로젝트에 필요한 자금을 마련했다. 이러한 대규모 채권 발행은 무디스 수석 신용 담당자인 에밀 엘 넴스가 언급한 바와 같이 "AI 컴퓨팅 수요 증가에 따른 용량 제약에 대응하기 위한 명확한 추세"로 분석된다.​ 뱅크 오브 아메리카 데이터에 따르면 9월과 10월 두 달 간에만 750억 달러의 AI 관련 부채가 새로 발행됐으며, 이는 과거 10년간 연평균 발행액의 두 배 이