[빅테크칼럼] 오픈AI, 코드네임 'Garlic' 모델로 경쟁사 압도…AI 경쟁 2026년으로 본격화

2025년 10월 6일(현지시각) 미 샌프란시스코 포트메이슨에서 열린 오픈AI '데브데이2025' 행사에서 샘 올트먼 오픈AI CEO가 연설하고 있다. / 연합뉴스

[뉴스스페이스=김정영 기자] 최근 오픈AI가 코딩과 추론 분야에서 경쟁사들을 압도할 것으로 평가받는 'Garlic'이라는 코드네임의 신형 대규모 언어 모델 개발에 박차를 가하고 있다.

The Information, Fortune, Investing.com 등 주요 외신은 오픈AI의 내부 평가에서 Garlic이 구글의 제미나이3와 앤트로픽의 Claude Opus 4.5를 특히 코딩 및 추론 과제에서 앞서는 성과를 보였다고 보도했다. 이는 2025년 말 기준으로 치열해진 글로벌 AI 경쟁의 새로운 국면을 보여주는 신호로, 오픈AI는 Garlic을 GPT-5.2 또는 GPT-5.5로 2026년 초에 공개할 계획이다.

벤치마크 데이터로 본 경쟁력

Garlic의 내부 평가에서 보고된 주요 성과는 다음과 같다. 오픈AI는 SWE-bench Verified(소프트웨어 엔지니어링 벤치마크)에서 제미나이3 Pro의 76.2%, GPT-5.1의 76.3%에 비해 Garlic이 80% 이상의 성능을 목표로 하고 있으며, Claude Opus 4.5의 80.9%와 견줄 수 있는 수준에 도달할 것으로 예상된다.

제미나이3 Pro는 GPQA Diamond(고급 과학 문제)에서 91.9%를 기록해 GPT-5.1(88.1%)을 앞섰으며, ARC-AGI-2(추상적 시각 추론)에서는 31.1%로 GPT-5.1(17.6%)의 두 배에 가까운 점수를 기록했다. Claude Opus 4.5는 SWE-bench Verified에서 80% 이상의 성능을 보이며, 앤트로픽의 내부 소프트웨어 엔지니어링 시험에서도 역대 최고 점수를 기록했다. 이러한 벤치마크는 AI 모델의 실제 업무 적용 능력을 객관적으로 평가하는 지표로 평가된다.

경쟁사들의 성장과 오픈AI의 대응

구글은 2025년 11월 18일 제미나이3를 출시해 검색, 이미지 편집, 멀티모달 추론 등에서 벤치마크 1위를 차지했다. 제미나이3 Pro는 Humanity’s Last Exam(일반 추론)에서 37.4점으로 GPT-5 Pro의 31.64점을 넘어섰으며, LMArena(사용자 만족도)에서도 최고 점수를 기록했다.

앤트로픽은 11월 24일 Claude Opus 4.5를 발표하며, 복잡한 엔터프라이즈 과제에서 이전 모델 대비 성능이 크게 향상됐다고 강조했다. 이에 따라 Google의 제미나이앱 월간 활성 사용자는 2025년 10월 기준 6억5000만명으로 7월의 4억5000만명에서 급증했으며, 챗GPT의 주간 8억명과의 격차가 좁혀지고 있다는 보도가 나왔다.

연구 리더십과 조직 변화

오픈AI의 최고 연구 책임자 마크 첸은 DALL-E, Codex, o1 추론 모델 등 주요 프로젝트를 이끌며, Garlic 모델 개발을 통해 경쟁사들과의 격차를 다시 벌리겠다는 전략을 내세우고 있다. 그러나 오픈AI는 최근 수십 명의 최고 연구원들이 Meta 등 경쟁사와 신생 스타트업으로 이직하는 등 인력 유출에 직면해 있다. CEO 샘 올트먼은 12월 1일 '코드 레드'를 선언하며, 광고 계획 등 다른 이니셔티브를 연기하고 ChatGPT의 반응성, 신뢰성, 개인화 기능 강화에 자원을 집중하겠다고 밝혔다.

AI 경쟁의 새로운 국면

오픈AI의 Garlic 모델은 단순한 기술적 진보를 넘어, 경쟁사와의 벤치마크에서 구체적인 성능 차이를 보여주며 AI 시장의 판도를 재편할 가능성이 높다. 향후 2026년 초 공개될 Garlic이 GPT-5.2 또는 GPT-5.5로 브랜딩된다면, 기업과 개발자들에게 새로운 선택지를 제공할 것으로 예상된다. AI 경쟁은 단순한 성능 비교를 넘어, 효율성과 비용, 안정성, 실제 업무 적용 능력 등 다양한 차원에서 더욱 치열해질 전망이다.

빅테크

[빅테크칼럼] 오픈AI, 코드네임 'Garlic' 모델로 경쟁사 압도…AI 경쟁 2026년으로 본격화

관련기사

이 시각 추천뉴스

[빅테크칼럼] 아틀라스 vs 옵티머스 '맞짱'…5조 달러 휴머노이드 전쟁, 현대차·테슬라 누가 앞서나

[빅테크칼럼] 오픈AI, 국방부 계약 '감시금지' 조항 추가로 앤트로픽 공백 메우기…2억달러 파장 속 올트먼 "기회주의 반성"

[빅테크칼럼] '美 클로드 AI 활용' 이란 공격에 中 '화들짝'…"AI 군사화 기술 자립 박차"

[빅테크칼럼] 앤트로픽, Claude 메모리 기능 전면 개방·경쟁사 데이터 가져오기 도구 '출시'…펜타곤 충돌 속 사용자 폭발적 유입

[CEO혜윰] 이세돌, 알파고 쇼크 10주년 맞아 같은 장소에서 AI와 재회…승부에서 파트너십으로

[지구칼럼] 367만년 전 인류 조상 얼굴은 이런 모습?…, 디지털로 복원된 리틀 풋, 인류 진화지도 밝힌다

[The Numbers] 보스턴다이내믹스 100조 상장설, 정의선에 ‘20조 탄환’…현대차 순환출자 끊는 초대형 승계 시나리오

[빅테크칼럼] 트럼프 'AI 금지령' 엄포에도 미군 이란 공습서 클로드 동원...저가 샤헤드 복제 드론 첫 실전

[이슈&논란] 한국 시각장애 유튜버, 머스크의 뉴럴링크 임상실험에 공개 지원…“뇌에 칩 이식으로 다시 눈 뜰까”

많이 본 뉴스

[이슈&논란] 핀란드 전 정보국장 "벨라루스 배치된 러시아 오레시니크 미사일, 오히려 파괴 위험에 더 노출됐다" 경고

[The Numbers] KAI, KF-21 양산 폭풍으로 항공우주 제국 건설 착수…5.7조 매출·10.4조 수주 폭발 '예고'

[내궁내정] 집안 ‘둘째’가 제일 잘 나간다는 말, 과학으로 확인가능?…학력·IQ·소득은 ‘첫째’ 범죄·문제행동은 ‘둘째' 더 많아

[빅테크칼럼] 인텔 CEO “2028년까지 메모리 부족”...공급자 황금시대 돌입에 삼성·SK하닉·마이크론, 몸값 폭등

[빅테크칼럼] OpenClaw AI 어시스턴트, 보안 분석에서 100점 만점에 2점…폭발적 성장에 숨겨진 5000개 취약점

[지구칼럼] 남극 심층 미스터리 풀렸다…블러드 폭포의 붉은 분출과 7000만년 '중력 구멍' 기원

[The Numbers] 모건스탠리·JP모건, 삼성전자·SK하이닉스 목표가 잇따라 상향…"강세장 28만원, 160만원 가능"

[이슈&논란] '젠틀몬스터 표절 의혹'으로 블루엘리펀트 대표 구속…안경계 '카피캣' 경고·300억 신흥세력 몰락 위기

[우주칼럼] 36년 만에 정월대보름과 겹친 개기월식, 3월 3일 저녁 전국서 관측…붉은 보름달의 귀환

[우주칼럼] 지구인의 화성 정착, 인간 DNA를 영원히 바꿀 '진화의 덫'…"되돌릴 수 없는 생물학적 변화" 가능성 제기

[랭킹연구소] 한국인 가장 많이 사용 증권사 앱 순위…미래에셋증권∙키움증권∙삼성증권∙한투증권∙KB증권∙나무증권 順

[이슈&논란] 이더리움 창립자 비탈릭 부테린, '80% 덤핑 매도' 충격...투매? '오픈테크 자선 혁명' 신호탄

[이슈&논란] 삼성, 모든 글로벌 서면 커뮤니케이션에 영어 사용 의무화…삼성전자·삼성디스플레이·삼성바이오로직스 우선 적용

[이슈&논란] SK온, 1조원 규모 2차 ESS 정부 입찰서 50% 수주 '대반전'…누적 25% 육박

[빅테크칼럼] 오픈AI, '성인 모드'에 대한 우려 제기한 임원 해고…안전 vs 수익 경쟁의 역설

[The Numbers] 삼성전자·SK하이닉스 시가총액, 사상 처음으로 알리바바·텐센트 추월…한국 반도체 vs 중국 빅테크, 시총 전쟁 'HBM 패권'

[빅테크칼럼] “20대 Z세대, 부모보다 IQ·기억력 낮은데 똑똑한 줄 안다”…'지능 역행' 충격의 진짜 이유

[공간사회학] 광화문 스타벅스 덮친 ‘아시아나 승무원 가방’…‘열린 좌석 정책’이 드러낸 공유지의 비극

[빅테크칼럼] XRP '공포의 저점' 70% 폭락…리플 CEO, 버핏 명언 인용하며 역발상 전략 권유

[The Numbers] 삼성SDI, 삼성디스플레이 지분 매각 추진…10원 현금 확보로 배터리 부활 노린다

[내궁내정] "금메달 아니어도 착용 가능·사랑도 페어플레이" 동계올림픽 콘돔사용이 더 많은 이유…올림픽 콘돔 '최초부터 최대까지'

[이슈&논란] 빗썸 '비트코인 62만개 폭탄' 오발사 "초대형 사고에 패닉"…99.7% 회수에도 133억원 '블랙홀'

[빅테크칼럼] '아동포르노 천국' 애플 아이클라우드, 방치로 소송 폭탄…"아동포르노 유통 최적 플랫폼"

[빅테크칼럼] 앤트로픽, 더 강력해진 AI '클로드 오퍼스4.6' 공개…벤치마크서도 챗GPT·제미나이 능가

[공간사회학] 이란공습 보복으로 아부다비 공항 사망자 발생

[이슈&논란] 서울 전세대란 현실화 속 신축 아파트 고공행진…‘래미안 엘라비네·오티에르 반포·써밋 더힐' 청약 주목

[The Numbers] 코스피 6200 돌파의 비결…뱅크오브아메리카 분석한 '한국 강세장 4대 불꽃'

[빅테크칼럼] 한국 배터리 TOP3, '전고체 배터리'로 EV 위기 돌파구 '모색'…삼성SDI·LG엔솔·SK온, 로봇시장 공략 가속

[빅테크칼럼] 챗GPT '야한 대화' 모드 코드 유출…성인 콘텐츠 시대 본격 개막하나

[The Numbers] 블랙록, 한국 ETF에 4000억원대 '사상 최대' 유입…"美 빅테크에서 韓 삼성·SK로 자산 이동"

[공간사회학] 이혜훈에 빛바랜 원펜타스, 최가온이 金으로 빛냈다…"주민의 자랑" 현수막 '화제'

[랭킹연구소] 10억 이상 고액자산가들 가장 많이 사들인 종목?…연초 자금 절반 삼성·하이닉스 직행·'반도체 AI 베팅' 폭주

[The Numbers] 글로벌 리스크 뚫고 코스피 5677…반도체 6.7배·증권 ETF 70% ‘괴물 랠리’

[빅테크칼럼] 애플, 뉴욕·런던·상하이에서 3월 4일 글로벌 '체험' 이벤트…M5 혁명 임박

[빅테크칼럼] 메모리 쇼크, 삼성 모바일 사업부 강타…갤럭시 S26 가격 급등 위기 속 애플 안정적 대응 '대조'

[빅테크칼럼] 발렌타인데이 앞둔 'AI 연인'의 최후…오픈AI, 사용자 자살 관련 소송 속 GPT-4o 서비스 중단

[The Numbers] 마이크로소프트 AI 거품 붕괴 신호?…닷컴 이후 최악 실적에 투자자 '패닉'

[영웅시대] 한국-영국 '컬링 로맨스' 설예은♥바비 래미…밀라노 올림픽서 '동반 금메달' 노린다

[우주칼럼] NASA "아직 미발견 '도시 파괴급' 소행성 1만5000개에 달한다"…탐지율 40%, 존재조차 몰라 '무방비'

[내궁내정] 2026년 병오년(丙午年) ’붉은 말'의 해, 왜?…10간·12지 유래, 동물과 색깔