2026.06.14 (일)

  • 구름많음동두천 28.0℃
  • 구름많음강릉 26.2℃
  • 천둥번개서울 25.0℃
  • 구름많음대전 31.1℃
  • 맑음대구 30.5℃
  • 구름많음울산 25.9℃
  • 맑음광주 28.5℃
  • 맑음부산 26.4℃
  • 구름많음고창 25.6℃
  • 맑음제주 28.2℃
  • 맑음강화 26.4℃
  • 구름많음보은 26.6℃
  • 흐림금산 22.7℃
  • 맑음강진군 29.7℃
  • 구름많음경주시 28.7℃
  • 맑음거제 27.8℃
기상청 제공

빅테크

[빅테크칼럼] “모르는 건 모른다”… 정직성 키운 앤트로픽 ‘Claude Opus 4.8’, AI 신뢰 경쟁의 새 기준

 

[뉴스스페이스=이현주 기자] 미국 AI 스타트업 앤트로픽이 5월 28일(현지시간) 차세대 플래그십 모델 ‘Claude Opus 4.8’을 공개하며 생성형 AI 경쟁의 축을 ‘정직성(honesty)’과 ‘동적 워크플로(dynamic workflows)’로 옮기고 있다. 4월 중순 Opus 4.7 출시 후 불과 6주 만의 속도전이지만, 단순 성능 튜닝이 아니라 “모르는 것은 모른다고 말하는 AI”를 전면에 내세운 점이 이번 업데이트의 핵심 변화다.

 

Opus 4.8은 우선 정량 성능에서 전작을 상회한다. 에이전트 코딩(agentic coding) 벤치마크 점수는 64.3%에서 69.2%로, 도구 활용 다학제 추론(multidisciplinary reasoning with tools)은 54.7%에서 57.9%로 상승했다. 지식 노동(knowledge work) 종합 점수도 1,753점에서 1,890점으로 올라, 실무형 문서 작성·분석 업무에서 체감 성능이 개선됐다는 평가다.

 

그럼에도 가격은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러로 동결해, 비용 대비 성능 비율(Bang for the buck)을 높였다. 여기에 연구 프리뷰로 제공되는 패스트 모드(Fast Mode)는 동일 모델에서 응답 속도를 최대 2.5배까지 끌어올리면서, 기존 패스트 모드 대비 비용을 3분의 1 수준으로 낮췄다.

 

이번 버전에서 가장 눈에 띄는 변화는 ‘정직성’이다. 앤트로픽과 초기 테스터들에 따르면, Opus 4.8은 자신이 작성한 코드의 결함을 그냥 통과시키는 비율이 Opus 4.7 대비 약 4분의 1 수준으로 줄어들었다. 잘 모르는 영역에서 근거 없는 답을 단정적으로 내놓기보다, 불확실하다고 스스로 플래그를 달고 사용자의 추가 지시를 요청하는 빈도가 늘어난 것이다.

 

이는 모델이 틀릴 수 있다는 전제는 그대로 두되, ‘틀렸는데도 확신하는 척하는(hallucination with confidence)’ 위험을 줄이겠다는 설계 철학의 반영으로 해석된다. 앤트로픽은 Opus 4.8이 정렬(alignment) 평가지표에서도 프로사회적 행동 비율을 개선하고, 잘못된 행동을 시도하는 비율을 추가로 낮췄다고 밝혔다.

 

사용자 경험 측면에서는 “진짜 협업자와 일하는 느낌”이라는 평가가 반복된다. 초기 사용자와 기업 파트너들은 Opus 4.8이 이전 세대보다 더 많은 clarifying 질문을 던지고, 작업 계획에 논리적 구멍이 있을 경우 묵묵히 따르기보다는 문제점을 지적하며 수정을 요구하는 경향을 보였다고 전한다.

 

장기 실행(long-horizon) 분석을 수행한 브리지워터(Bridgewater) 등 테스트 기관들도 “더 빠르게 과업을 마치면서도 분석 내용은 이전 Opus 모델보다 일관되게 더 풍부했다”고 평가해, 단순 비서형을 넘어 파트너형 AI에 한 걸음 가까워졌다는 인상을 남긴다.

 

개발자와 기업 고객을 겨냥한 구조적 변화도 크다. 앤트로픽은 Opus 4.8과 함께 코드 특화 환경인 ‘Claude Code’에 ‘다이나믹 워크플로(Dynamic Workflows)’ 기능을 연구 프리뷰로 도입했다. 이를 통해 모델은 단일 작업 세션 안에서 수백 개의 병렬 서브에이전트(sub-agent)를 자동으로 기획·실행하고, 각 결과를 상호 검증한 뒤 통합해 하나의 응답으로 반환할 수 있다. 회사 측은 이 기능을 활용하면 수십만 줄 규모의 대형 코드베이스 마이그레이션도 “사람이 짠 계획을 AI가 대신 수행·검증하는” 방식으로 처리할 수 있다고 설명한다.

 

사용자가 모델의 ‘사고 깊이’를 직접 조정할 수 있는 ‘에포트 컨트롤(Effort Control)’도 새롭게 추가됐다. Claude.ai와 Claude Code의 기본값은 High로 설정하되, 사용자는 저(빠르고 가벼운 응답)에서 고(최대 수준의 심층 추론)까지 단계적으로 선택할 수 있다. 여기에 ‘어댑티브 싱킹(Adaptive Thinking)’ 옵션을 켜면, 모델이 각 턴마다 난도를 판단해 필요한 경우에만 내부 추론을 수행하기 때문에 혼합 난도의 워크로드에서 불필요한 추론 토큰 낭비를 줄일 수 있다는 설명이다.

 

이번 발표의 또 다른 축은 ‘수평선 너머의 Mythos’다. 앤트로픽은 Opus 4.8 발표와 병행해, “Opus보다 훨씬 높은 지능을 갖춘 새로운 등급의 모델”을 개발 중이라고 예고했다. 그 상징이 바로 ‘Mythos Preview’로, 사이버보안·침투 테스트 등 고위험 영역에서의 성능이 워낙 강력해 현재는 Project Glasswing 프로그램을 통해 초대 기반(Invitation-only)으로만 제한 공개되고 있다.

 

이 모델은 이미 아마존웹서비스(AWS), 애플, 구글, 마이크로소프트, 엔비디아 등 빅테크와 보안 민감도가 높은 기관들의 파일럿 테스트에 투입된 상태다. 앤트로픽은 향후 몇 주 내에 미국 및 동맹국 정부를 포함한 추가 파트너로 Mythos급 접근을 확대하고, 보다 강력한 안전장치가 정비되는 대로 일반 공개도 추진하겠다는 방침을 밝혔다.

 

Opus 4.8은 현재 앤트로픽 웹 서비스(claude.ai), 공식 API(claude-opus-4-8), 아마존 베드록(Amazon Bedrock), 구글 버텍스 AI(Vertex AI), 마이크로소프트 파운드리(Microsoft Foundry) 등 주요 클라우드 플랫폼에서 바로 사용할 수 있다. 언뜻 보면 “4.7의 마이너 업그레이드”처럼 보이지만, 정직성·에이전트형 워크플로·사용자 통제력이라는 세 축에서 AI 협업 경험을 ‘속도 경쟁’에서 ‘신뢰 경쟁’으로 돌려세우려는 시도라는 점에서 업계의 주목을 받고 있다.

배너
배너
배너

관련기사

87건의 관련기사 더보기


[빅테크칼럼] 한 주도 안 팔고 15년 버티니 스페이스X 30조 '잭팟'…3번 폭발 본 뒤에도 '믿음의 장투'

[뉴스스페이스=김정영 기자] 스페이스X 상장을 앞두고 15년간 ‘한 주도 안 판’ 초기 투자자 저스틴 피슈너 울프슨이 최대 30조원대 평가이익을 눈앞에 두면서, 장기 비상장 투자 전략의 상징적 사례로 부상하고 있다. 스페이스X가 예고대로 1조7700억달러 수준의 몸값으로 뉴욕 시장에 입성할 경우, 울프슨이 이끄는 137 벤처스는 단일 포지션으로만 200억달러(약 30조4000억원)에 달하는 지분 가치를 거머쥐게 된다. 15년 ‘노셀’ 버틴 벤처캐피털리스트 뉴욕타임스 등 외신 보도에 따르면, 샌프란시스코 기반 벤처캐피털 137 벤처스를 이끄는 저스틴 피슈너 울프슨(44)은 2011년부터 15년간 스페이스X 비상장 주식을 꾸준히 매입해 현재 회사 지분 1% 이상을 보유 중인 것으로 전해진다. 그는 스페이스X가 스타트업에 가깝던 시절, 직원 보유 지분과 구주 거래 등을 통해 물량을 모았고, 그 과정에서 단 한 주도 매도하지 않았다는 점이 투자 업계의 주목을 받고 있다. 울프슨은 “상장 첫날 주가는 네 배가 될 수도, 50% 떨어질 수도 있다”며 변동성을 경고하면서도, 여전히 “내가 믿는 회사”라며 장기 보유 의지를 드러냈다. 1조7700억달러 IPO, 200억달러

[이슈&논란] “이어캡은 팔면서 헤어밴드는 왜 안 파나”…애플 에어팟 맥스 이용자들의 불만 커지는 이유

[뉴스스페이스=이승원 기자] 애플의 프리미엄 헤드폰인 에어팟 맥스(AirPods Max)가 출시 6년차에 접어들면서 사용자들 사이에서 반복적으로 제기되는 불만이 있다. 바로 헤어밴드 메시(캐노피) 노화 문제다. 에어팟 맥스 헤어밴드 메시 노화 논란은 단순한 ‘미관 문제’를 넘어, 수리권·제품 수명·프리미엄 전략이 한 지점에서 충돌하는 사례로 부상하고 있다. 애플이 이어쿠션은 별도 판매하면서도, 구조적으로 분리 가능한 헤어밴드에 대해서는 여전히 공식 교체 부품과 소비자용 프로그램을 열지 않고 있다는 점이 이용자 불만의 핵심이다. “캐노피가 늘어진다”…6년 차에 본격화된 고질병 에어팟 맥스는 머리 위를 받치는 부분에 탄성 메쉬 캐노피 구조를 적용해, 출시 초기에는 “무게 대비 착용감이 뛰어나다”는 평가를 받았다. 그러나 출시 후 수년이 지나면서 해외 커뮤니티와 국내 게시판에는 “헤어밴드 메쉬가 늘어나 금속 프레임이 정수리를 직접 누른다”, “몇 분만 써도 정수리 통증이 온다”는 사례가 반복적으로 보고되고 있다. 특히 Reddit의 r/Airpodsmax 포럼과 애플 디스커션 게시판에는 “메쉬 탄성이 떨어지면서 머리 위에 철제 빔이 직접 닿는 느낌”이라는 불만이

[빅테크칼럼] 메타·마누스 20억달러 딜 '파기' 수순…중국, ‘완료된 M&A’도 뒤집는 AI 통제력 과시

[뉴스스페이스=이종화 기자] 메타 플랫폼스가 중국계 AI 스타트업 마누스(Manus)와의 데이터·시스템 연계를 전면 차단하면서, 20억달러(약 3조원) 규모로 성사됐던 인수 거래가 사실상 해체 국면에 들어갔다. 블룸버그 뉴스에 따르면, 메타 플랫폼스는 중국계 AI 스타트업 Manus와의 운영적 분리를 완료하고, 6월 초부터 모든 데이터 공유를 중단하는 동시에 Manus 직원들의 내부 시스템 접근을 전면 차단했다. 메타, 20억달러 베팅 뒤집힌 뒤 ‘데이터 셧다운’ 싱가포르에 본사를 둔 에이전틱(agentic) AI 서비스 마누스를 2025년 12월 말 약 20억달러(일부 외신은 20억~26억달러 범위로 보도)를 주고 통째로 인수했던 메타는, 불과 4개월 만에 중국 규제당국의 ‘철회 명령’을 맞았다. 중국 국가발전개혁위원회(NDRC) 외국인투자안전심사 판공실은 2026년 4월 말 성명을 통해 “법규에 따라 마누스에 대한 외국인 투자를 금지하고, 당사자들에게 인수 거래 철회를 요구한다”고 공식 발표했다. 블룸버그와 현지 매체에 따르면 메타는 6월 초부터 마누스와의 데이터 공유를 전면 중단했고, 마누스 직원들의 메타 내부 데이터·시스템 접근도 모두 차단했다. 메타