2025.11.17 (월)

  • 맑음동두천 4.1℃
  • 맑음강릉 9.9℃
  • 구름많음서울 3.8℃
  • 구름많음대전 7.8℃
  • 맑음대구 9.7℃
  • 맑음울산 12.0℃
  • 구름많음광주 8.4℃
  • 연무부산 13.8℃
  • 구름많음고창 8.5℃
  • 맑음제주 14.5℃
  • 구름많음강화 2.5℃
  • 구름많음보은 6.2℃
  • 구름많음금산 7.1℃
  • 구름조금강진군 10.4℃
  • 맑음경주시 11.4℃
  • 구름조금거제 13.7℃
기상청 제공

빅테크

[빅테크칼럼] AI 체스 승부서 '오픈AI o3, 머스크의 그록4 완파'…"체스發 AI 혁명경쟁의 집대성"

 

[뉴스스페이스=이종화 기자] 글로벌 대형 언어모델(AI) 간 첫 메이저 체스 토너먼트에서 오픈AI의 o3 모델이 xAI의 그록 4를 상대로 4-0 완승을 기록했다. 2025년 8월 7일~8일(현지시간), 구글 Kaggle Game Arena에서 열린 이번 토너먼트는 AI의 전략적 추론과 한계, 그리고 혁신적 진화를 객관적 데이터로 표출한 이정표였다.

 

Chess.com, Kaggle Arena 현장 중계, Magnus Carlsen 전문 분석과 함께 Indian Express, Financial Express, Gigazine.net, The Verge등의 매체들을 취합해 AI들의 체스 슈퍼매치에 대해 알아봤다.

 

“체스판 위 AI 전쟁”…o3의 기술력과 완승


경기는 단 4세트 만에 끝났다. o3는 모든 판에서 체크메이트를 이뤄냈고, 체스닷컴 분석에 따르면 수 정확도 90.8%(그록 4는 80.2%)라는 압도적 수치로 결승 무대를 지배했다. 세트별 수순도 각각 35, 30, 28, 54수로, 난공불락의 운영을 보여줬다.

 

구글 제미나이 2.5 Pro가 오픈AI의 o4-mini를 3.5–0.5로 꺾고 3위를 차지하면서 이 대회는 단순한 게임 그 이상이었다.

 

참여 모델들은 오픈AI(o3, o4-mini), xAI(그록 4), 구글(Gemini 2.5 Pro, 2.5 Flash), 앤트로픽(Claude 4 Opus), 딥시크(DeepSeek R1), Moonshot AI(Kimi k2) 등 현존 최강 LLM 기업들의 ‘올스타’ 대진표로, 전문 체스 엔진이 아닌 범용 LLM 기반 ‘AI의 실제 추론력’을 평가하는 자리였다.

 

 

“아마추어도 아까운 그록”…마그누스 칼센의 혹평


해설을 맡은 세계 챔피언 마그누스 칼센은 그록의 경기력을 “마치 어린이 게임 같았다”고 혹평했다. 그는 그록 4의 실수를 조목조목 지적하며 “퀸을 여러 번 허무하게 내줬고, 전략적 깊이가 전혀 없었다”고 평가했다.

 

그록의 체스 레이팅은 800점, o3는 1200점 수준으로 모두 일반 동호인보다 낮았다는 냉정한 분석도 내놨다. 이 수치는 국제 체스 연맹(FIDE)이 인정하는 초보자(800점)~클럽 수준(1200점) 레벨에 해당한다는 설명이다.

 

‘올트먼 vs 머스크’…법정·체스판으로 번진 라이벌리그


토너먼트 자체보다 더 큰 화제를 모은 건, 오픈AI CEO 샘 올트먼과 xAI 창립자 일론 머스크의 라이벌 구도였다. 두 사람은 오픈AI 공동창업자였으나 2018년 경영권 불화로 결별, 이후 법정공방에서도 첨예하게 대립해왔다.

 

그록 4가 대패하자 머스크는 X(前 트위터)에서 “xAI는 체스에 거의 노력을 기울이지 않았다. 그록의 체스 능력은 그냥 부작용”이라며 자존심을 세웠다.

 

 

‘AI 슈퍼매치’가 던진 시사점


이번 대회는 단순 승패를 넘어 AI의 ‘지능 인플레이션’을 냉정하게 드러낸 장이었다. 실제로 두 모델 모두 체스 전문 엔진보다 수준이 낮았으며, 인간의 창의적인 장기전술 적용이나 복합 상황 해법에서는 여전히 허점을 보여줬다. 이번 승리의 주인공 o3조차 FIDE 마스터는커녕 일반 동호인~동호인 고수 수준에 그쳤다.


특히, o3의 체계적 말읽기(strategy operation), 그록 4의 반복되는 전략 실수(blunder, queen sacrifice) 등은 AI의 한계이자 미래 기술 진화의 숙제를 남겼다. 코멘트만 봐도 “그록 4의 수많은 초보적 실수와 o3의 단조로운 공격은 LLM 기반 AI가 아직은 ‘사고의 깊이’가 부족함을 역설적으로 입증”했다는 평가다.

 

“GPT-5 시대” 서막…AI 전쟁은 계속된다


한편, 오픈AI는 결승전 직후 GPT-5 론칭도 공식 발표했다. 빅테크 업계 보도에 따르면 GPT-5는 2025년 8월 중 출시될 예정이다. 신모델 예고와 함께, Kaggle AI 체스전은 ‘AI 진화의 속도와 철학, 그리고 생성형 AI의 실제 두뇌’를 집단 실험 방식으로 입증해낸 상징적 사건으로 남았다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] "혈당을 넘어 당뇨병 합병증 근본 해결"…NYU 연구진, 염증 원천 표적하는 혁신 약물 RAGE406R 개발

[뉴스스페이스=김시민 기자] 최근 미국 뉴욕대학(NYU) 랭곤 헬스 연구진이 혈당 조절과 무관하게 당뇨병 합병증의 근본 원인을 표적하는 혁신적 저분자 화합물 RAGE406R을 개발해 주목받고 있다. 이 약물은 당뇨병 환자에서 흔히 발생하는 염증과 조직 손상, 특히 상처 치유 지연 문제를 획기적으로 개선하는 효과를 보였다. 연구 결과는 2025년 11월 14일 생화학 분야의 권위지 ‘Cell Chemical Biology’에 발표됐다.​ 현재 당뇨병 치료제는 주로 혈당 수치를 낮추는데 집중되어 있으나, 심혈관 질환, 신장 질환, 만성 염증과 같은 합병증에 직접 작용하는 치료법은 미비한 실정이다. 이번 연구에서 RAGE406R은 당뇨병 환자의 세포 내에서 염증 신호를 촉발하는 RAGE(최종당화산물 수용체)와 DIAPH1 단백질의 상호작용을 차단하는 기전으로 작동한다. 이 상호작용이 억제되면서 염증 매개물질 CCL2의 분비가 현저히 줄어들어 대식세포 내 염증 반응이 완화됐다.​ 특히, 비만형 제2형 당뇨병 생쥐에 국소 적용된 실험에서 RAGE406R은 상처 치유 속도를 대폭 높여, 치유 지연으로 고통받는 당뇨환자에게 실질적 도움을 줄 수 있음을 증명했다. 남녀 당

[빅테크칼럼] 테슬라, 美 전기차 생산서 중국산 부품 전면 배제…"미중갈등 지정학 리스크 대응차원"

[뉴스스페이스=김정영 기자] 글로벌 전기차 선두주자 테슬라가 미국 내 생산 전기차에 사용되는 부품에서 중국산을 전면 배제하는 전략을 본격 추진하고 있다. 이는 미·중 간 고조된 지정학적 긴장과 무역 분쟁에 따른 공급망 리스크를 최소화하고, 관세 부담을 줄이기 위한 조치로 평가받는다. 월스트리트저널, 로이터, CBS, 배터리테크온라인, 테슬라매그에 따르면, 테슬라와 주요 공급업체들은 이미 미국에서 생산되는 전기차에 들어가는 일부 중국산 부품을 현지 혹은 타지역에서 생산된 부품으로 대체했으며, 앞으로 1~2년 내에 모든 중국산 부품을 중국 외 지역에서 조달한 부품으로 교체하는 것을 목표로 한다. 이 같은 결정은 2025년 초 확정됐으며, 공급망 다변화의 일환으로 코로나19 팬데믹 당시 중국산 부품 수급 차질 경험과 올해 들어 미국 정부가 중국산 품목에 고율 관세를 부과한 영향이 컸다.​ 특히 테슬라가 대체에 가장 난항을 겪는 부문은 LFP(리튬인산철) 배터리다. 기존에 중국 CATL이 주요 공급사였던 LFP 배터리는 미국 내 판매 차량의 세액공제 대상에서 중국산 배터리를 장착한 차량이 제외되면서 사용이 중단됐다. 이에 테슬라는 네바다주에 10GWh 규모의 자체