2026.03.04 (수)

  • 맑음동두천 0.0℃
  • 구름많음강릉 2.6℃
  • 맑음서울 3.3℃
  • 맑음대전 3.5℃
  • 흐림대구 5.9℃
  • 흐림울산 5.3℃
  • 맑음광주 5.8℃
  • 구름많음부산 6.3℃
  • 맑음고창 2.3℃
  • 맑음제주 8.9℃
  • 구름많음강화 2.8℃
  • 맑음보은 1.6℃
  • 구름많음금산 2.7℃
  • 맑음강진군 3.2℃
  • 흐림경주시 5.5℃
  • 흐림거제 5.7℃
기상청 제공

빅테크

[빅테크칼럼] 오픈AI, 코드네임 'Garlic' 모델로 경쟁사 압도…AI 경쟁 2026년으로 본격화

 

[뉴스스페이스=김정영 기자] 최근 오픈AI가 코딩과 추론 분야에서 경쟁사들을 압도할 것으로 평가받는 'Garlic'이라는 코드네임의 신형 대규모 언어 모델 개발에 박차를 가하고 있다.

 

The Information, Fortune, Investing.com 등 주요 외신은 오픈AI의 내부 평가에서 Garlic이 구글의 제미나이3와 앤트로픽의 Claude Opus 4.5를 특히 코딩 및 추론 과제에서 앞서는 성과를 보였다고 보도했다. 이는 2025년 말 기준으로 치열해진 글로벌 AI 경쟁의 새로운 국면을 보여주는 신호로, 오픈AI는 Garlic을 GPT-5.2 또는 GPT-5.5로 2026년 초에 공개할 계획이다.​

 

벤치마크 데이터로 본 경쟁력

 

Garlic의 내부 평가에서 보고된 주요 성과는 다음과 같다. 오픈AI는 SWE-bench Verified(소프트웨어 엔지니어링 벤치마크)에서 제미나이3 Pro의 76.2%, GPT-5.1의 76.3%에 비해 Garlic이 80% 이상의 성능을 목표로 하고 있으며, Claude Opus 4.5의 80.9%와 견줄 수 있는 수준에 도달할 것으로 예상된다.

 

제미나이3 Pro는 GPQA Diamond(고급 과학 문제)에서 91.9%를 기록해 GPT-5.1(88.1%)을 앞섰으며, ARC-AGI-2(추상적 시각 추론)에서는 31.1%로 GPT-5.1(17.6%)의 두 배에 가까운 점수를 기록했다. Claude Opus 4.5는 SWE-bench Verified에서 80% 이상의 성능을 보이며, 앤트로픽의 내부 소프트웨어 엔지니어링 시험에서도 역대 최고 점수를 기록했다. 이러한 벤치마크는 AI 모델의 실제 업무 적용 능력을 객관적으로 평가하는 지표로 평가된다.​

 

경쟁사들의 성장과 오픈AI의 대응

 

구글은 2025년 11월 18일 제미나이3를 출시해 검색, 이미지 편집, 멀티모달 추론 등에서 벤치마크 1위를 차지했다. 제미나이3 Pro는 Humanity’s Last Exam(일반 추론)에서 37.4점으로 GPT-5 Pro의 31.64점을 넘어섰으며, LMArena(사용자 만족도)에서도 최고 점수를 기록했다.

 

앤트로픽은 11월 24일 Claude Opus 4.5를 발표하며, 복잡한 엔터프라이즈 과제에서 이전 모델 대비 성능이 크게 향상됐다고 강조했다. 이에 따라 Google의 제미나이앱 월간 활성 사용자는 2025년 10월 기준 6억5000만명으로 7월의 4억5000만명에서 급증했으며, 챗GPT의 주간 8억명과의 격차가 좁혀지고 있다는 보도가 나왔다.

 

연구 리더십과 조직 변화


오픈AI의 최고 연구 책임자 마크 첸은 DALL-E, Codex, o1 추론 모델 등 주요 프로젝트를 이끌며, Garlic 모델 개발을 통해 경쟁사들과의 격차를 다시 벌리겠다는 전략을 내세우고 있다. 그러나 오픈AI는 최근 수십 명의 최고 연구원들이 Meta 등 경쟁사와 신생 스타트업으로 이직하는 등 인력 유출에 직면해 있다. CEO 샘 올트먼은 12월 1일 '코드 레드'를 선언하며, 광고 계획 등 다른 이니셔티브를 연기하고 ChatGPT의 반응성, 신뢰성, 개인화 기능 강화에 자원을 집중하겠다고 밝혔다.

 

AI 경쟁의 새로운 국면

 

오픈AI의 Garlic 모델은 단순한 기술적 진보를 넘어, 경쟁사와의 벤치마크에서 구체적인 성능 차이를 보여주며 AI 시장의 판도를 재편할 가능성이 높다. 향후 2026년 초 공개될 Garlic이 GPT-5.2 또는 GPT-5.5로 브랜딩된다면, 기업과 개발자들에게 새로운 선택지를 제공할 것으로 예상된다. AI 경쟁은 단순한 성능 비교를 넘어, 효율성과 비용, 안정성, 실제 업무 적용 능력 등 다양한 차원에서 더욱 치열해질 전망이다.​

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] '美 클로드 AI 활용' 이란 공격에 中 '화들짝'…"AI 군사화 기술 자립 박차"

[뉴스스페이스=이승원 기자] 미군이 이란 공습에서 ‘AI 기반 표적식별·시나리오 시뮬레이션’까지 실전에 투입했다는 보도가 나오자, 중국 내부에서 “AI 군사화는 더는 선택이 아니라 기술 자립의 문제”라는 경계론이 급부상하고 있다. 동시에 트럼프 행정부가 구글·xAI·오픈AI 등과 국방 AI 도입을 확장하는 흐름이 맞물리며, 미·중 ‘국방 AI 생태계’ 격차가 지정학 리스크로 재부상하는 양상이다. SCMP(사우스차이나모닝포스트)는 "미군의 대이란 작전이 전자전(EW)·정보수집·AI 보조작전이 결합된 형태로 전개되며, 중국에 전자전·정보·AI 통합의 압박을 키웠다"고 전했다. 같은 보도에서 미군이 1,000개가 넘는 표적을 타격했다는 서술은, AI가 결합될 때 작전의 속도·규모가 비약적으로 커질 수 있음을 시사한다. 또 WSJ(월스트리트저널)를 인용한 해외 보도에 따르면 미 중부사령부(CENTCOM)는 앤트로픽의 ‘클로드(Claude)’를 활용해 영상·신호정보를 분석하고 표적 식별, 전투 시나리오 시뮬레이션까지 수행한 것으로 전해졌다. “미 국방-빅테크 결합”이 만든 격차 미 국방부는 구글·xAI·오픈AI·앤트로픽에 각각 최대 2억 달러 규모 계약을 부여해 국방

[The Numbers] 보스턴다이내믹스 100조 상장설, 정의선에 ‘20조 탄환’…현대차 순환출자 끊는 초대형 승계 시나리오

[뉴스스페이스=김정영 기자] 보스턴다이내믹스(BD)의 미국 상장(IPO)이 ‘로봇 빅딜’을 넘어 현대차그룹 지배구조 개편과 정의선 회장 승계 구도의 ‘게임 체인저’로 부상하고 있다. BD 상장 시계 빨라진 배경: 로봇·AI에서 재무 중심 회사로 올해 CES 2026에서 휴머노이드 ‘아틀라스(Atlas)’가 글로벌 주목을 받으면서 BD의 몸값은 단숨에 로봇·AI 대표주자로 격상됐다. BD는 그간 엔지니어·기술 중심 조직이었지만 최근 CEO가 기술통 로버트 플레이터에서 재무통인 어맨다 맥매스터 CFO(직무대행) 체제로 바뀌며, 상장을 전제로 한 ‘재무·수익 중심’ 회사로 선회하고 있다. 현대차그룹 내부에선 장재훈 부회장 직속 로보틱스·AI 전략 TFT를 신설하고, M&A·전략투자 인력을 전면 배치하며 BD를 축으로 한 로봇 포트폴리오 재편에 본격 나선 상태다. BD는 로봇 제어용 AI 소프트웨어 스타트업 ‘필드AI(Field AI)’에 수백만달러를 투입하고, 글로벌 AI·로보틱스 전문가 밀란 코박을 사외이사로 영입하는 등 상용화와 미국 IPO를 의식한 외연 확장에도 속도를 내고 있다. 업계와 증권가는 “2026년 상반기 나스닥 예비심사 청구·주관사 선정

[이슈&논란] 한국 시각장애 유튜버, 머스크의 뉴럴링크 임상실험에 공개 지원…“뇌에 칩 이식으로 다시 눈 뜰까”

[뉴스스페이스=김혜주 기자] 시각장애인 유튜버 ‘원샷한솔’(본명 김한솔·32)이 일론 머스크가 이끄는 뇌신경기술 스타트업 뉴럴링크의 시력 회복 프로젝트 ‘블라인드사이트(Blindsight)’ 임상시험에 직접 지원했다고 밝혀 국내외 의료·기술 커뮤니티에 주목을 받고 있다. 지난 2월 7일 유튜브 채널 ‘원샷한솔’에는 “미국 올 수 있냐길래 갈 수 있다고 해버렸다. 뇌에 칩 심는 임상실험(어그로 아님)”이라는 제목의 영상이 게재됐으며, 김한솔은 자신이 뉴럴링크의 블라인드사이트 임상시험에 참여 의사를 밝혔다고 공개했다. 김한솔은 시력 상실 이력과 관련해서 2010년 버스 통학 중 시력 이상을 감지한 뒤 약 2~3개월 만에 시력을 모두 잃었다고 소개하며, 현재는 시각장애인 유튜버로 160만명 수준의 구독자를 보유한 크리에이터로 활동 중이다. ​ 김한솔은 "눈이 보이는 게 아니라, 뇌가 보이게 하는 기술"이라고 해당 기술을 소개하며 "수술은 로봇이 하고 1시간 정도 걸린다고 들었다. 기술은 정말 좋지만, 나쁘게 쓰이면 무섭지 않겠나. 혹시 내 생각을 들여다보거나 해킹당할 수도 있는 것 아닌지 걱정도 된다"고 했다. 이어 "돈이 있는 사람만 눈을 뜨고, 돈이 없는 사람