2026.01.30 (금)

  • 맑음동두천 -7.4℃
  • 맑음강릉 -3.8℃
  • 맑음서울 -5.7℃
  • 구름많음대전 -4.4℃
  • 맑음대구 -0.4℃
  • 맑음울산 -1.9℃
  • 흐림광주 -2.5℃
  • 맑음부산 -0.1℃
  • 흐림고창 -4.4℃
  • 구름조금제주 2.3℃
  • 맑음강화 -8.4℃
  • 흐림보은 -5.2℃
  • 구름조금금산 -3.2℃
  • 구름조금강진군 -1.6℃
  • 맑음경주시 -2.0℃
  • 구름많음거제 -1.4℃
기상청 제공

빅테크

[빅테크칼럼] 머스크의 'xAI 그록5, AGI 현실화' 선언...인공지능 대전환점 될까

 

[뉴스스페이스=윤슬 기자] 일론 머스크가 자신의 AI 벤처 xAI가 올해 말 출시 예정인 그록5(Grok 5)로 인공일반지능(AGI) 달성 가능성을 언급하면서 AI 업계에 파장이 일고 있다. 현재 그록4가 ARC-AGI 벤치마크에서 기록적 성과를 거두며 경쟁사를 제치고 1위를 차지한 가운데, 머스크의 이번 발언은 AGI 경쟁에서 새로운 전환점을 시사하는 것으로 해석되고 있다.

 

NextTech Today, TESLARATI, India Today, THE-DECODER에 따르면, 일론 머스크는 9월 16일(현지시간) 늦게 자신의 X 계정에 "xAI가 그록5로 AGI에 도달할 가능성이 있다고 생각한다"며 "이전에는 그럴 수 있다고 생각해본 적이 없었다"고 밝혔다.

 

이는 그록4가 ARC-AGI 추론 벤치마크에서 15.9%의 점수로 최고 자리에 오른 직후 나온 발언으로, 오픈AI의 GPT-5(9.9%)와 클로드 4 오푸스(8.6%)를 크게 앞선 성과가 뒷받침됐다.

 

ARC-AGI 벤치마크, AI의 '지능 측정 기준'으로 부상


ARC-AGI(Abstraction and Reasoning Corpus for Artificial General Intelligence)는 AI가 이전에 학습하지 않은 새로운 문제를 해결하는 능력을 측정하는 벤치마크로, 현재 AGI 달성도를 가늠하는 가장 중요한 지표로 인정받고 있다. 이 테스트는 단순히 기억된 정보에 의존하는 것이 아니라 추상적 사고와 일반화 능력을 평가한다는 점에서 진정한 '지능'을 측정하는 도구로 여겨진다.

 

그록4가 ARC-AGI-2에서 15.9%를 기록한 것은 작업당 2-4달러의 비용이 들었지만, GPT-5의 9.9%(작업당 0.73달러)보다 현저히 높은 성과다. 더 쉬운 ARC-AGI-1에서도 그록4는 68%를 기록해 GPT-5의 65.7%를 앞섰다. ARC Prize 재단의 그레고리 캄랏 회장은 "그록4를 사용한 두 건의 최고 제출물이 나왔으며, 작성자들이 '테스트에서 사용한 최고의 모델이었다'고 말했다"고 전했다.

 

20만 GPU 콜로서스 슈퍼컴퓨터, 그록5 훈련 뒷받침

 

xAI는 그록5 훈련을 위해 세계 최대 규모의 AI 슈퍼컴퓨터 '콜로서스(Colossus)'를 운영하고 있다. 테네시주 멤피스에 위치한 이 시설은 현재 10만개의 엔비디아 H100 GPU로 시작해 20만개로 확장됐으며, 향후 100만개까지 늘릴 계획이다. 시스템 구축에는 불과 122일이 소요됐으며, 첫 랙 설치 후 19일 만에 훈련을 시작하는 기록적인 속도를 보였다.

 

콜로서스는 42-56메가와트의 전력을 소비하며, 향후 150메가와트까지 확장될 예정이다. 엔비디아의 스펙트럼-X 이더넷 네트워킹 플랫폼을 활용해 95%의 데이터 처리량을 달성했으며, 애플리케이션 지연이나 패킷 손실 없이 운영되고 있다고 발표됐다.

 

내부 혼란 속 20세 대학생이 핵심팀 리더로


그록5 개발을 앞두고 xAI 내부에는 큰 변화가 일어나고 있다. 회사는 지난주 데이터 주석(annotation) 팀에서 500명 이상을 해고했으며, 이는 전체 1500명 규모 팀의 3분의 1에 해당한다. 해고 과정에서 20세 대학생 디에고 파시니(Diego Pasini)가 그록의 학습 데이터 라벨링을 담당하는 핵심 팀의 새로운 리더로 임명됐다.

 

펜실베이니아 대학 와튼스쿨에 휴학 중인 파시니는 올해 1월 xAI에 입사한 후 8개월 만에 이 중요한 역할을 맡게 됐다. 그는 직원들을 대상으로 STEM, 코딩, 금융, 의학뿐만 아니라 그록의 '성격' 및 '안전성'까지 다루는 다양한 평가를 실시했다. 이러한 인사 변동은 xAI가 일반적인 AI 튜터보다 전문 분야별 특화 AI 튜터 개발에 집중하겠다는 전략 전환의 일환으로 해석된다.

 

테슬라와의 시너지, FSD·로보틱스 혁신 기대


머스크는 xAI와 테슬라 간 잠재적 통합 가능성을 시사해 왔다. 테슬라는 지난 7월 xAI에 50억 달러 투자를 검토한다고 발표했으며, 이는 그록의 고급 추론 능력을 테슬라의 완전자율주행(FSD) 및 로보틱스 프로그램에 통합하기 위한 전략으로 분석된다.

 

테슬라의 FSD v12는 이미 엔드투엔드(end-to-end) 신경망 아키텍처로 전환해 카메라 입력을 직접 운전 제어 명령으로 변환하고 있다. 여기에 그록의 실시간 데이터 처리 및 추론 능력이 결합되면, 복잡한 엣지 케이스 처리에서 획기적 개선이 가능할 것으로 전망된다. 또한 휴머노이드 로봇 옵티머스(Optimus) 개발에도 같은 AI 기술이 활용될 예정이어서 상당한 시너지 효과가 예상된다.

 

AGI 경쟁 가속화, 업계 판도 변화 예고


현재 AGI에 대한 명확한 정의는 없지만, 일반적으로 인간 수준의 인지 능력을 모든 영역에서 발휘할 수 있는 AI 시스템을 의미한다. 머스크의 그록5 AGI 가능성 언급은 오픈AI, 구글, 안트로픽 등 주요 AI 기업들과의 경쟁을 더욱 치열하게 만들 전망이다.

 

특히 오픈AI의 o3 모델이 ARC-AGI-1에서 75.7%의 높은 점수를 기록했지만 작업당 200달러라는 높은 비용이 문제가 되고 있어, xAI의 효율성 중심 접근법이 주목받고 있다. 그록4는 비슷한 성능을 훨씬 낮은 비용으로 달성했으며, 이는 상업적 활용 가능성 측면에서 중요한 의미를 갖는다.

 

올해 말 출시, AI 역사의 분수령 될까


머스크는 그록5 훈련이 "몇 주 후 시작되며 올해 말 출시될 것"이라고 확인했다. 업계 관측통들은 새로운 모델이 멀티모달 입력과 환각(hallucination)을 줄이면서 컨텍스트 윈도우를 확장하는 개선된 '사고' 아키텍처를 도입할 것으로 예상한다고 전했다.

 

만약 그록5가 실제로 AGI에 근접한 성능을 보인다면, 이는 AI 발전사에서 중요한 전환점이 될 가능성이 높다. 다만 전문가들은 AGI 달성 주장에 대해서는 신중한 검증이 필요하다고 지적하고 있으며, 특히 안전성과 윤리적 측면에서의 준비가 선행되어야 한다고 강조하고 있다.

 

현재 투자자와 연구자들은 그록5의 실제 훈련 결과가 머스크의 대담한 예측을 현실로 바꿀 수 있을지 주목하고 있다. 그 결과는 단순히 xAI의 성공을 넘어 인류의 AGI 도달 시점을 가늠하는 중요한 지표가 될 전망이다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] "AI에 짝사랑 상담했더니 상대에게 문자 보냈다"…'선넘은' AI 에이전트의 '오작동 폭주'

[뉴스스페이스=김정영 기자] 구글의 AI 서비스 제미나이(Gemini)가 사용자 대화 내용을 바탕으로 지인에게 임의로 문자 메시지를 발송한 사례가 한국에서 논란을 일으키며, AI 에이전트의 오작동 위험이 부각되고 있다. 이 사건은 단순 실수가 아닌, AI가 실제 행동을 수행하는 과정에서 사용자 통제 미비를 드러낸 사례로, 국내외에서 유사 피해가 잇따르고 있다. 최근 한국 사용자 A씨는 제미나이와의 대화 중 중국 밀입국 가상 시나리오를 논의하던 과정에서 AI가 생성한 '밀입국 선언문'이 새벽에 친분이 얕은 지인에게 문자로 발송된 경험을 SNS에 공개했다. A씨는 AI에 항의했으나 "멋대로 전송됐다"고 주장했다. 유사 사례로 "짝사랑 상담시 상대에게 문자 보내려 함"이나 "대화 중 인권위에 전화 시도" 등의 경험담이 안드로이드 사용자들 사이에서 쏟아졌다. 제미나이는 안드로이드에서 문자·전화 기능을 공식 지원하나, 대화 흐름 중 확인 팝업에 무심코 '예'를 누를 경우 민감 정보가 부적절한 수신자에게 전달될 위험이 지적된다. 한국 과학기술정보통신부 보고서에 따르면, 2025년 사이버 침해사고 신고 건수는 2383건으로 전년(1887건) 대비 26.3% 급증했으며,