2026.04.19 (일)

  • 구름많음동두천 11.6℃
  • 구름많음강릉 14.3℃
  • 구름많음서울 14.8℃
  • 구름많음대전 12.9℃
  • 흐림대구 13.6℃
  • 박무울산 14.2℃
  • 흐림광주 15.8℃
  • 흐림부산 15.8℃
  • 흐림고창 13.0℃
  • 제주 18.5℃
  • 맑음강화 11.0℃
  • 구름많음보은 9.1℃
  • 흐림금산 10.3℃
  • 흐림강진군 14.1℃
  • 흐림경주시 13.5℃
  • 구름많음거제 15.9℃
기상청 제공

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

 

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

 

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

 

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

 

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약


이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

 

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

 

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

 

경쟁 모델과 격차 ‘수치로 입증’


최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

 

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

 

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정


오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

 

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

 

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] TSMC CEO "테슬라와 인텔은 고객이자 경쟁자"…머스크의 테라팹이 흔드는 ‘파운드리 3강’ 질서

[뉴스스페이스=김정영 기자] TSMC C.C. 웨이 CEO가 2026년 1분기 실적 발표 콜에서 테슬라와 인텔을 동시에 “고객이자 경쟁자”로 지목하면서, 일론 머스크의 초대형 반도체 프로젝트 ‘테라팹(Terafab)’이 글로벌 파운드리 판도에 던지는 파장이 본격적으로 드러나고 있다. 웨이는 “파운드리 산업에는 지름길이 없다”며 기술·생산·신뢰를 3대 원칙으로 재확인했고, 머스크는 같은 시기 AI5 칩 테이프아웃 완료를 선언하며 TSMC·삼성·인텔을 아우르는 다중 파운드리·내재화 전략을 전면에 올렸다. TSMC “테슬라·인텔, 고객이자 동시에 경쟁자” 웨이 CEO는 실적 콜에서 JP모건 애널리스트의 질문에 답하며 “인텔과 테슬라는 모두 TSMC의 고객이자, 동시에 경쟁자”라고 규정했다. 특히 인텔에 대해서는 “formidable competitor(강력한 경쟁자)”라는 표현을 쓰며, 경쟁사이지만 결코 과소평가할 수 없는 존재임을 분명히 했다. 그는 파운드리 사업의 본질에 대해 “기술적 리더십, 우수한 제조 역량, 고객 신뢰라는 기본 원칙은 변한 적이 없다”고 강조하면서, 새로운 팹을 짓는 데만 2~3년, 양산 체제를 안정화하는 데 추가 1~2년이 걸린다고 설명

[빅테크칼럼] 엔비디아 젠슨 황 "앤트로픽 투자 기회 놓친 것은 내 실수"발언의 속셈?…GPU·풀스택 전략의 압도적 우위 자신감 '역설적 신호'

[뉴스스페이스=이현주 기자] 엔비디아 젠슨 황 CEO가 앤트로픽(Anthropic) 투자 초기 기회를 놓친 것을 두고 “내 실수(my miss)”라고 공개 인정했다는 사실은, 동시에 그가 여전히 자사 GPU·풀스택 전략의 압도적 우위를 자신하고 있다는 역설적인 신호이기도 하다. 황 CEO는 최근 드와르케시 파텔(Dwarkesh Patel)과의 팟캐스트 인터뷰에서 구글·AWS의 커스텀 AI 칩이 엔비디아 시장 지배력에 실질적 위협이 되느냐는 질문을 정면으로 받았다. 그는 “엔비디아보다 의미 있게 뛰어난 플랫폼을 만드는 것은 결코 쉬운 일이 아니다”라며, 경쟁 구도를 ‘성능·TCO·생태계’의 총합 싸움으로 재정의했다. 이 과정에서 가장 눈에 띄는 대목은 앤트로픽을 둘러싼 발언이다. 젠슨 황은 “앤트로픽이 없었다면 TPU 성장의 이유가 뭐가 되겠느냐, TPU 성장은 100% 앤트로픽 덕분”이라며, AWS의 Trainium 역시 “성장이 있다면 그것도 100% 앤트로픽”이라고 잘라 말했다. 국내외 매체 보도를 종합하면, 앤트로픽은 구글·브로드컴과 2027년부터 약 3.5GW 규모의 TPU 용량을 순차 공급받는 계약을 체결했으며, 구글과의 이전 계약에서는 최대 100