2026.04.16 (목)

  • 맑음동두천 10.8℃
  • 맑음강릉 8.7℃
  • 맑음서울 14.3℃
  • 맑음대전 15.2℃
  • 맑음대구 10.3℃
  • 맑음울산 11.7℃
  • 맑음광주 13.5℃
  • 맑음부산 12.2℃
  • 맑음고창 14.5℃
  • 맑음제주 14.8℃
  • 맑음강화 11.7℃
  • 맑음보은 12.6℃
  • 맑음금산 9.3℃
  • 맑음강진군 10.6℃
  • 맑음경주시 11.4℃
  • 맑음거제 10.3℃
기상청 제공

빅테크

[빅테크칼럼] 오픈AI, 코드네임 'Garlic' 모델로 경쟁사 압도…AI 경쟁 2026년으로 본격화

 

[뉴스스페이스=김정영 기자] 최근 오픈AI가 코딩과 추론 분야에서 경쟁사들을 압도할 것으로 평가받는 'Garlic'이라는 코드네임의 신형 대규모 언어 모델 개발에 박차를 가하고 있다.

 

The Information, Fortune, Investing.com 등 주요 외신은 오픈AI의 내부 평가에서 Garlic이 구글의 제미나이3와 앤트로픽의 Claude Opus 4.5를 특히 코딩 및 추론 과제에서 앞서는 성과를 보였다고 보도했다. 이는 2025년 말 기준으로 치열해진 글로벌 AI 경쟁의 새로운 국면을 보여주는 신호로, 오픈AI는 Garlic을 GPT-5.2 또는 GPT-5.5로 2026년 초에 공개할 계획이다.​

 

벤치마크 데이터로 본 경쟁력

 

Garlic의 내부 평가에서 보고된 주요 성과는 다음과 같다. 오픈AI는 SWE-bench Verified(소프트웨어 엔지니어링 벤치마크)에서 제미나이3 Pro의 76.2%, GPT-5.1의 76.3%에 비해 Garlic이 80% 이상의 성능을 목표로 하고 있으며, Claude Opus 4.5의 80.9%와 견줄 수 있는 수준에 도달할 것으로 예상된다.

 

제미나이3 Pro는 GPQA Diamond(고급 과학 문제)에서 91.9%를 기록해 GPT-5.1(88.1%)을 앞섰으며, ARC-AGI-2(추상적 시각 추론)에서는 31.1%로 GPT-5.1(17.6%)의 두 배에 가까운 점수를 기록했다. Claude Opus 4.5는 SWE-bench Verified에서 80% 이상의 성능을 보이며, 앤트로픽의 내부 소프트웨어 엔지니어링 시험에서도 역대 최고 점수를 기록했다. 이러한 벤치마크는 AI 모델의 실제 업무 적용 능력을 객관적으로 평가하는 지표로 평가된다.​

 

경쟁사들의 성장과 오픈AI의 대응

 

구글은 2025년 11월 18일 제미나이3를 출시해 검색, 이미지 편집, 멀티모달 추론 등에서 벤치마크 1위를 차지했다. 제미나이3 Pro는 Humanity’s Last Exam(일반 추론)에서 37.4점으로 GPT-5 Pro의 31.64점을 넘어섰으며, LMArena(사용자 만족도)에서도 최고 점수를 기록했다.

 

앤트로픽은 11월 24일 Claude Opus 4.5를 발표하며, 복잡한 엔터프라이즈 과제에서 이전 모델 대비 성능이 크게 향상됐다고 강조했다. 이에 따라 Google의 제미나이앱 월간 활성 사용자는 2025년 10월 기준 6억5000만명으로 7월의 4억5000만명에서 급증했으며, 챗GPT의 주간 8억명과의 격차가 좁혀지고 있다는 보도가 나왔다.

 

연구 리더십과 조직 변화


오픈AI의 최고 연구 책임자 마크 첸은 DALL-E, Codex, o1 추론 모델 등 주요 프로젝트를 이끌며, Garlic 모델 개발을 통해 경쟁사들과의 격차를 다시 벌리겠다는 전략을 내세우고 있다. 그러나 오픈AI는 최근 수십 명의 최고 연구원들이 Meta 등 경쟁사와 신생 스타트업으로 이직하는 등 인력 유출에 직면해 있다. CEO 샘 올트먼은 12월 1일 '코드 레드'를 선언하며, 광고 계획 등 다른 이니셔티브를 연기하고 ChatGPT의 반응성, 신뢰성, 개인화 기능 강화에 자원을 집중하겠다고 밝혔다.

 

AI 경쟁의 새로운 국면

 

오픈AI의 Garlic 모델은 단순한 기술적 진보를 넘어, 경쟁사와의 벤치마크에서 구체적인 성능 차이를 보여주며 AI 시장의 판도를 재편할 가능성이 높다. 향후 2026년 초 공개될 Garlic이 GPT-5.2 또는 GPT-5.5로 브랜딩된다면, 기업과 개발자들에게 새로운 선택지를 제공할 것으로 예상된다. AI 경쟁은 단순한 성능 비교를 넘어, 효율성과 비용, 안정성, 실제 업무 적용 능력 등 다양한 차원에서 더욱 치열해질 전망이다.​

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 가족 사진까지 꺼낸 올트먼…화염병 테러가 드러낸 ‘AGI의 반지’ 권력전쟁

[뉴스스페이스=이현주 기자] 오픈AI 최고경영자(CEO) 샘 올트먼이 자택 화염병 테러 직후 새벽에 올린 블로그 글은 단순한 심경 고백을 넘어, AI 권력 구조와 민주주의, 그리고 미디어 책임을 둘러싼 정치·사회적 선언문에 가깝다. 4월 10일(현지시간) 오전 4시12분 전후, 미국 샌프란시스코 노스비치 지역에 위치한 올트먼 자택 대문에는 화염병이 던져졌다. 샌프란시스코 경찰에 따르면 화염병은 문과 외벽 일부를 그을렸지만, 인명 피해는 발생하지 않았다. 사건 1시간가량 뒤인 오전 5시7분, 같은 남성이 3번가에 위치한 오픈AI 본사 앞에서 건물을 불태우겠다고 협박했고, 출동한 경찰에 현장에서 체포됐다. 용의자는 20세 남성으로, 신원과 구체적인 범행 동기는 아직 공개되지 않았다. 이 사건은 챗GPT를 비롯한 생성형 AI에 대한 불안과 반발이 전 세계적으로 고조되는 가운데 발생했다는 점에서, ‘AI 공포’가 물리적 폭력으로 번진 첫 상징적 사례로 받아들여지고 있다. “이것은 내 가족 사진이다”…가장 사적인 이미지의 정치화 사건 직후 올트먼은 평소 철저히 숨겨왔던 가족 사진을 공개하는 이례적 행보를 택했다. 그는 블로그에서 “이것은 내 가족 사진이다. 나는 그

[빅테크칼럼] 엔비디아 독주에 칼 빼든 앤트로픽…‘3.5GW 동맹’ 넘어 자체 AI 칩까지 노린다

[뉴스스페이스=김정영 기자] 미국 AI 스타트업 앤트로픽(Anthropic)이 자체 AI 칩 개발을 검토하고 있다고 로이터 통신은 9일(현지시간) 복수의 소식통을 인용해 보도했다. 전 세계적인 AI 수요 폭증으로 고성능 반도체 품귀와 가격 급등이 이어지자, 중장기적으로 안정적인 연산 인프라를 확보하기 위한 전략의 하나라는 해석이 나온다. 다만 논의는 극초기 단계로, 아직 전담 조직도 꾸려지지 않았고 구체적인 칩 아키텍처 설계 역시 착수하지 않은 상태라며, 상황에 따라 프로젝트가 전면 백지화될 수 있다는 점을 소식통들은 분명히 했다. 로이터는 첨단 AI 칩 설계·생산 체제를 구축하는 데 숙련 공학자 확보와 제조 파트너십까지 감안하면 약 5억달러(약 7400억원) 안팎의 초기 비용이 들어갈 수 있다고 전했다. GPU 의존도와 ‘멀티 벤더’ 전략의 한계 앤트로픽은 현재 엔비디아 GPU뿐 아니라 아마존웹서비스(AWS)의 ‘트레이니엄(Trainium)’, 구글 클라우드의 텐서 처리 장치(TPU) 등 빅테크의 전용 AI 칩을 폭넓게 사용하는 ‘멀티 벤더’ 구조를 구축해 왔다. AWS는 앤트로픽의 초기 핵심 파트너이자 주요 AI 고객사로, 자사 고성능 칩과 슈퍼컴퓨팅 인