2025.11.12 (수)

  • 맑음동두천 15.6℃
  • 맑음강릉 18.3℃
  • 맑음서울 16.8℃
  • 구름많음대전 15.0℃
  • 흐림대구 12.6℃
  • 흐림울산 15.4℃
  • 흐림광주 12.3℃
  • 흐림부산 17.1℃
  • 흐림고창 11.8℃
  • 흐림제주 17.2℃
  • 맑음강화 14.7℃
  • 구름많음보은 14.0℃
  • 흐림금산 12.6℃
  • 흐림강진군 13.7℃
  • 구름많음경주시 15.6℃
  • 흐림거제 13.9℃
기상청 제공

빅테크

오픈AI, 국제수학올림피아드 금메달 ‘충격’…"인간 수학을 넘어선 새역사·인간문명에 도전장"

 

[뉴스스페이스=김정영 기자] 2025년 7월, 인공지능(AI)이 또 한 번 역사를 썼다. 오픈AI(OpenAI)가 개발한 범용 추론 언어 모델이 세계 최고 고등학생 수학 경진대회인 국제수학올림피아드(IMO)에서 ‘금메달 수준’ 성적을 공식 인증받았다.

 

Business Insider, TechCrunch, Engadget 등의 매체와 Simon Willison’s Weblog, lesswrong.com, THE-DECODER.com 등의 자료를 분석한 결과에 따르면, 이 모델은 인간과 동등한 조건(두 번의 4.5시간 시험 세션, 인터넷∙계산도구 미사용)에서 출제된 6개 문제 가운데 5개를 완벽히 풀어내며, 42점 만점에 35점을 획득해 금메달 기준점을 넉넉히 넘었다.

 

IMO는 630명의 참가자 중 약 67명(전체의 10% 정도)만이 금메달을 따는 세계에서 가장 까다로운 대회로 알려져 있다. 오픈AI의 모델은 이 대회에서 실제 인간 수상자들과 같은 방식, 동일한 평가지침 아래서 전직 IMO 메달리스트 심사위원 3인에 의해 각각 채점됐고, 만장일치로 점수가 확정됐다.

 

“단일 과업 특화 모델 아니다”…범용 AI의 본격 도약


이번 성과는 전문 수학 프로그램이 아닌 일반 범용 대화형 AI가 달성했다는 점이 더욱 충격적이다.

 

연구원 Alexander Wei는 이번 성과가 “특정 과업 최적화가 아니라, 범용 강화학습과 시험 시 컴퓨팅 확장(test-time compute scaling)의 신기술을 적용한 결과”라고 밝혔다. 모델은 인간처럼 문제를 자연어(영어)로 서술해가며 해설했고, 기존 LLM(대규모 언어 모델)과 달리 시험 중 답을 내기까지 ‘수 시간’을 집중적으로 고민하는 접근으로 높은 평가를 받았다.

 

오픈AI 연구원 Noam Brown은 “최고의 인간과 AI의 약간 차이는 엄청난 차이”라고 강조했다.

 

경쟁 모델과 격차 ‘수치로 입증’


최근 MathArena.ai가 주요 상용 및 연구 모델(Gemini 2.5 Pro, Grok-4, o3 등)을 동일한 IMO 2025 문제로 평가한 결과, 최고 성적을 기록한 Gemini 2.5 Pro가 13점(42점 만점, 약 31%)에 그치며 동메달 커트라인(19점)에도 미달했다는 점은 AI 간 ‘성능 격차’의 현실을 수치로 단적으로 드러낸다.

 

심지어 일부 모델은 논리적 오류, 불완전한 해설, 심지어 없는 정리까지 만들어내는 등 한계를 노출했다는 것이 해외 IT매체들의 지적이다.

 

“곧 출시될 GPT-5와는 다른 연구 성과”…일반 공개는 미정


오픈AI는 “이 모델은 실험적으로만 개발된 연구용 시스템으로, 수 개월 내에라도 대중에 공개할 계획이 없다”고 못박았다. 대신 곧 공개될 예정인 GPT-5는 별도 팀이 개발 중인 소비자용 모델로, 이번 수학 올림피아드 금메달 성능과는 직접 관련이 없음을 분명히 했다.

 

AI 추론력의 한계 돌파…수학을 넘어 ‘문명 패러다임’ 바꿀까

 

AI의 수학 고차원 문제 해결력은 그 자체로 미래 문명의 ‘패러다임 시프트’ 신호탄으로 주목받고 있다. 전문가들은 이번 성과가 단순 수치 향상을 넘어 ▲범용 추론력 강화 ▲복잡한 창의 문제 해결 ▲증명 중심의 자연어 의사소통 등 인간 학습과정의 핵심 단계마저 기계가 넘기 시작한 기점으로 해석한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 오픈AI, 헬스케어 시장에 출사표…"챗GPT 週 8억명 건강비서 도전"

[뉴스스페이스=윤슬 기자] 글로벌 AI 혁신을 선도하는 오픈AI가 헬스케어 분야에 본격 진출을 모색하고 있다. 특히 개인 건강 비서와 건강 데이터 통합 서비스 등 소비자용 헬스케어 도구 개발을 내부적으로 논의 중이며, 이를 위해 의료 및 건강 관련 핵심 인재 영입과 업계 협력에도 속도를 내고 있다. 로이터, 비즈니스 인사이더, 아크리브에 따르면, 오픈AI는 2025년 6월 미국 최대 의료 분야 네트워크 플랫폼 '독시미티' 공동 창업자이자 의사인 네이트 그로스를 헬스케어 전략 책임자로 영입한 데 이어, 8월에는 메타(페이스북)의 인스타그램에서 제품 총괄 경력을 가진 애슐리 알렉산더를 건강 제품 담당 부사장으로 데려왔다. 이들 리더십 하에 오픈AI는 의료 진단 보조부터 신약 개발 AI 도구 협력까지 사업 영역을 확장하고 있다. 챗GPT 이용자 규모는 주간 8억명에 육박하며, 상당수가 의료 관련 질문을 하고 있다. 샘 올트먼 CEO도 “건강 관리 분야에서 GPT 기술이 이용자들에게 실질적으로 도움을 줄 수 있다”고 밝힌 바 있다. 헬스케어 시장 진출은 단순한 AI 인프라 공급을 넘어, 의료 현장과 소비자에 직접 다가가는 전략으로 평가된다. 최근 오픈AI는 케냐 의

[빅테크칼럼] 테슬라 전기차 핵심 임원 대거 퇴사, 왜?…사이버트럭·모델Y 판매 부진이어 경영까지 '빨간불'

[뉴스스페이스=김정영 기자] 전기차 시장에서 독보적 위치를 점해온 테슬라에서 주요 전기차 사업 핵심 임원들이 잇달아 퇴사하고 있어 업계에 큰 파장을 일으키고 있다. 사이버트럭과 모델Y, 모델3 등 주력 차량을 총괄하며 테슬라의 미래 전략을 이끌던 간판 임원들이 한꺼번에 회사를 떠나면서 조직 내 불안정성이 심화되고 있다. 이는 판매 부진과 맞물려 경영 불확실성 확대로 해석된다. 로이터, 블룸버그, 비즈니스인사이더에 따르면, 최근 3년간 사이버트럭 개발과 양산을 책임졌던 시단트 아와스티는 8년간 몸담은 테슬라를 떠난다고 2025년 11월 9일 본인의 링크드인 계정을 통해 밝혔다. 아와스티는 2017년 인턴으로 입사해 사이버트럭 프로젝트를 주도했으며, 지난 7월부터는 주력 세단 모델3 담당으로 이동해 있었다. 같은 날 모델Y 담당 임원 이매뉴얼 라마키아도 8년간 근무를 마치고 퇴사 소식을 전했다. 두 임원 모두 구체적인 퇴사 이유나 향후 행보는 공개하지 않았다. 이번 임원 퇴사는 2024년부터 이어진 경영진 및 기술 인력들의 대거 이탈 현상의 연장선상에 있다. 소프트웨어 엔지니어링 부사장 데이비드 라우가 AI 기업 오픈AI로 이직했으며, 로봇 사업부 옵티머스 책임