2025.11.21 (금)

  • 맑음동두천 7.1℃
  • 맑음강릉 11.0℃
  • 맑음서울 8.8℃
  • 맑음대전 9.7℃
  • 맑음대구 9.9℃
  • 맑음울산 10.2℃
  • 구름조금광주 11.2℃
  • 맑음부산 11.0℃
  • 맑음고창 11.4℃
  • 구름조금제주 14.8℃
  • 맑음강화 8.6℃
  • 맑음보은 8.1℃
  • 맑음금산 9.5℃
  • 구름조금강진군 13.1℃
  • 맑음경주시 9.8℃
  • 맑음거제 10.8℃
기상청 제공

빅테크

챗GPT가 수능 국어 풀었더니 "1개 틀렸다"…오픈AI 최신 모델 'o1-프리뷰' 수능 1등급

 

[뉴스스페이스=김시민 기자] 인공지능(AI) 능력이 날로 진화, 발전되어 가는 가운데 수능 국어 영역 1등급을 받는 수준까지 올라섰다.

 

19일 거대언어모델(LLM)의 수능 국어 역량을 평가하는 ‘수능 국어 LLM 리더보드’에 따르면 올해 9월 출시된 오픈AI의 챗GPT o1-프리뷰 모델이 2025년도 수능 국어 영역에서 원점수 97점으로 1등급의 높은 성적을 기록했다. 즉 2025년 수능 국어 영역에서 단 1문제만 틀리고 모두 맞춘 셈이다. 선택 과목은 ‘화법과 작문’으로, 해당 과목의 추정 등급 컷은 93~95점 수준이다.

 

오픈소스 소프트웨어 웹사이트 ‘깃허브(GitHub)’에는 5개의 AI 모델이 2025학년도 수능 국어 영역을 푼 결과가 공개됐다. 5개 모델은 모두 챗GPT를 기반으로 한 모델로, o1 프리뷰와 o1 미니, GPT4o, GPT4o 미니, GPT3.5 터보가 사용됐다. 이번 테스트는 국내 AI 연구기업 마커AI에서 진행한 프로젝트다. 10년분의 수능 국어 시험을 대상으로 주요 LLM의 성능을 평가하는 것이 목적이다.

 

가장 높은 점수를 받은 모델은 오픈AI의 최신 모델인 o1 프리뷰로 원점수 97점을 받아 추정 등급컷 1등급을 기록했다. o1 미니와 GPT4o는 각 78점, 75점을 받아 추정 등급컷 4등급이고, GPT4o 미니는 5등급(원점수 59점), GPT3.5 터보는 8등급(원점수 16점)으로 추정된다.

 

수능 LLM 리더보드를 개발한 마크AI 연구원 진민성씨는 자신의 블로그에 “이전 수능 국어 10개년 LLM(거대언어모델, Large Language Model) 리더보드에서 성능 비교 결과, 1위를 차지한 gpt-4o가 평균등급 3등급대에 최고 점수는 86점을 차지했다”며 “2025 수능에서 기록한 97점이라는 만점에 가까운 점수는, LLM의 한국어 언어능력이 인간의 퍼포먼스를 뛰어넘을 시기가 머지 않았음을 보여준다”고 평가했다.

 

한편, 오픈AI가 지난 9월 공개한 최신 모델 ‘O1(오원)’은 인간의 추론 능력에 초점을 두고 개발해온 모델로, 단계적인 사고 과정을 통해 어려운 문제를 해결한다. 오픈AI는 이 모델이 국제수학올림피아드(IMO) 예선 시험에서 이전 모델 정답률이 13%인 데 비해 83%의 정답률을 기록했다고 설명했다.

 

오픈AI 최고경영자(CEO) 샘 올트먼은 이 모델을 “새로운 패러다임이다. 범용의 복잡한 문제를 추론할 수 있는 AI”라면서도 “이 기술이 여전히 결함이 있고, 제한적이다"고 설명한 바 있다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 소프트뱅크, AI 데이터센터 장비공장에 4.4조원 투자…오픈AI '스타게이트' 프로젝트 가속

[뉴스스페이스=윤슬 기자] 손정의 회장이 이끄는 소프트뱅크 그룹이 미국 오하이오주 로드스타운에 위치한 전기차 공장을 제너럴모터스와 폭스콘으로부터 인수, 약 30억 달러(한화 약 4조4000억원)를 투자해 AI 데이터센터용 장비를 생산하는 공장으로 전환한다. 이 장비들은 텍사스 밀럼 카운티에 건설 중인 오픈AI 데이터센터와 향후 공개될 추가 데이터센터에 공급될 예정이다. OpenAI 공식 발표, The Information, CNBC에 따르면, 이번에 생산될 장비들은 모듈식 구조로 설계되어 현장에서의 설치가 신속하고 용이하며, 데이터센터의 용량 확장도 점진적으로 가능해 기존 현장 건설 대비 가동 일정을 10~20% 단축할 수 있다. 모듈형 방식은 데이터센터 건설 기간을 약 12개월에서 7~8개월로 단축시키는 핵심 기술로 평가받고 있다. 짐 시모넬리 슈나이더 일렉트릭 최고기술책임자는 이 같은 모듈식 건설이 데이터센터 조기 가동에 결정적이라고 평가했다. 소프트뱅크는 지난 8월 이 공장을 3억7500만 달러에 인수했으며, 내년 1분기부터 생산에 착수할 계획이다. 이 공장 생산 장비는 AI 데이터센터 구축을 위한 핵심 인프라인 것으로 알려졌다. 이번 투자는 오픈AI가

[빅테크칼럼] 구글 '나노 바나나 프로', 이미지 AI 분야 패러다임 혁신 ‘업그레이드 돌풍'…미드저니·달리·파이어플라이와 '선두경쟁'

[뉴스스페이스=김정영 기자] 세계 이미지 생성 AI의 혁신적 진보를 알리는 신제품이 등장했다. 구글은 2025년 11월 20일(현지시간) 인공지능(AI) 이미지 생성 및 편집 도구 ‘나노 바나나 프로(Nano Banana Pro)’를 공식 출시하며, 최신 AI 모델 ‘제미나이3 프로(Gemini 3 Pro)’ 기반의 최첨단 서비스를 본격 제공한다고 밝혔다. 핵심 기능 및 기술적 특징 구글 발표 자료, 더버지, Statista에 따르면, 나노 바나나 프로는 구글의 이전 모델인 ‘나노 바나나(Nano Banana)’와 달리 최신 제미나이3 프로 엔진을 적용, 추론 능력과 디자인 기능을 대폭 강화했다. 최대 14개의 이미지를 입력해 이들을 조합, 새로운 이미지를 구현할 수 있으며 사진의 초점, 각도, 조명 변경은 물론, 낮 사진을 밤 사진으로 바꾸는 등 다양한 편집 옵션까지 지원한다. 해상도는 4K 초고화질까지 가능하며, 배경·구도·제시어(프롬프트) 기반 이미지 생성의 정확성·일관성을 크게 끌어올렸다. 특히 기존 AI 이미지 생성 모델의 고질적 문제였던 ‘글자 표현’ 영역이 전격 개선됐다. 새 버전은 캘리그라피와 디자인 요소가 포함된 이미지에서도 한국어·영어 등

[빅테크칼럼] 트럼프와 화해한 머스크, 워싱턴 정치무대 복귀…백악관 만찬 참석·2025 중간선거 지원 '신호탄'

[뉴스스페이스=윤슬 기자] 일론 머스크는 도널드 트럼프 미국 대통령과의 6개월간의 불화를 끝내고 2025년 11월 중순 워싱턴 정치 무대에 복귀했다. 머스크는 2025년 11월 18일 트럼프가 주최한 무함마드 빈살만 사우디아라비아 왕세자 환영 백악관 만찬에 참석하며 공개석상에 모습을 드러냈다. 이번 만찬 참석은 양측 관계가 완화됐음을 상징하며, 머스크가 정치적 영향력을 다시 행사할 준비를 하고 있음을 보여준다.​ 머스크는 2025년 5월 워싱턴을 떠나면서 트럼프에 대한 비판과 함께 제3정당 창당을 언급하는 등 갈등을 겪었으나, 이후 한랭해진 관계를 해빙하고 트럼프와 간헐적 대화를 재개했다. 특히 2025년 9월 보수 활동가 찰리 커크 추도식에서 두 사람의 화해 장면이 TV에 포착되기도 했다. 머스크는 제3정당 구상에서 후퇴한 상태이며, 자신 측근 인사의 정부 고위직 재지명으로 휴전 상태에 돌입한 것으로 알려졌다.​ 경제적 지원도 이어지고 있다. 머스크는 2024년 대선에 약 3억 달러를 투입해 트럼프를 지원했으며, 2025년 중간선거에서도 공화당 후보를 위한 기부를 재개할 예정이라고 측근들이 전했다. 이는 2025년 6월 이후 공화당 입법안에 반대하며 갈등을

[이슈&논란] 엡스타인 파일 연루된 래리 서머스 전 美재무, 오픈AI 이사직 전격 사임…"경제학자 명성 타격" 향후 파장은?

[뉴스스페이스=김정영 기자] 래리 서머스(71) 전 미국 재무장관이 미성년자 성범죄자 고(故) 제프리 엡스타인과 긴밀한 관계를 유지해온 사실이 최근 미 의회가 공개한 이메일 문서로 드러난 후 2025년 11월 19일(현지시간) 인공지능 기업 오픈AI 이사직에서 사임했다. 뉴욕타임스 보도에 따르면, 서머스 전 장관은 엡스타인과 2013년부터 2019년 체포 전까지 최소 7년간 수백 통의 이메일과 문자메시지를 주고받으며, 개인적인 연애 관련 조언을 주고받은 것으로 알려졌다.​ 사임 배경과 구체 정황 서머스 전 장관은 첨예한 비판과 논란이 일자 “깊은 수치심을 느끼며 모든 공적 임무에서 물러나겠다”는 입장을 공개했고, 이에 따라 19일 오픈AI 이사직에서도 사임 의사를 공식화했다. 오픈AI 측도 성명을 통해 그의 결정에 감사하며 존중한다고 밝혔다.​ 그가 주고받은 이메일 중 일부는 2018년 11월부터 2019년 7월 사이 부적절한 연애 관계에 대해 엡스타인에게 상담을 받은 내용도 포함돼 있다. 엡스타인은 서머스를 자신의 연애 ‘윙맨(도움자)’으로 자처하며 조언을 해준 정황까지 나타났다. 다만, 서머스가 엡스타인의 성범죄에 직접 연루됐다는 증거는 공개 자료에 포함

[빅테크칼럼] 테슬라, 로보택시 사이버캡, 판매 허가는 '아직'…완전 자율주행 시대, 미국서도 '벽'에 부딪히다

[뉴스스페이스=윤슬 기자] 전기차업체 테슬라가 로보(무인)택시 전용 자율주행차 '사이버캡'(Cybercab)의 판매 허가를 규제 당국으로부터 받지 못했다는 외신 보도가 나왔다. 테슬라가 미국에서 사이버캡을 출시하는 데 필요한 규제 면제 조치를 받지 못했으며, 아직 신청조차 하지 않았다고 미 경제매체 포브스는 11월 19일(현지시간) 보도했다. 현재 테슬라가 무인 자율주행 로보택시 '사이버캡'(Cybercab)의 대량 생산과 상용화를 추진하고 있지만, 미국 연방 정부의 규제 장벽에 막혀 출시가 사실상 불가능한 상황에 직면했다. 일론 머스크 CEO가 2025년 4월부터 사이버캡 양산을 시작하겠다고 선언했으나, 미국 도로교통안전국(NHTSA)은 테슬라가 사이버캡에 대한 규제 면제 신청조차 하지 않았다고 공식적으로 밝혔다. 이로 인해 운전대와 페달이 없는 완전 자율주행차의 미국 내 판매와 운행은 법적으로 불가능한 상태다. 테슬라가 로보택시 시장의 '게임 체인저'를 꿈꾸지만, 기술적 진보와 함께 규제·정치·사회적 신뢰라는 삼중고를 넘어야만 미래차 시장의 주도권을 잡을 수 있을 전망이다.​ 사이버캡, 완전 자율주행의 꿈과 현실의 괴리 테슬라가 내년 4월부터 양산을 목표