2026.04.18 (토)

  • 맑음동두천 27.4℃
  • 맑음강릉 26.7℃
  • 맑음서울 27.1℃
  • 구름많음대전 26.7℃
  • 흐림대구 23.3℃
  • 구름많음울산 22.2℃
  • 흐림광주 24.0℃
  • 구름많음부산 20.3℃
  • 흐림고창 20.9℃
  • 흐림제주 19.5℃
  • 맑음강화 20.4℃
  • 구름많음보은 25.7℃
  • 구름많음금산 26.8℃
  • 흐림강진군 20.9℃
  • 구름많음경주시 25.3℃
  • 구름많음거제 21.1℃
기상청 제공

빅테크

[빅테크칼럼] AI가 핵무기 오용을 96%의 정확도로 감지한다고?…앤트로픽-美핵안보국 '맞손'

 

[뉴스스페이스=김정영 기자] 인공지능(AI) 분야에서 민간기업과 미국 정부가 손잡고 개발한 획기적인 AI 도구가, 핵무기 개발에 AI 챗봇이 악용되는 것을 96%의 정확도로 감지하는 데 성공했다.

 

인공지능 스타트업 앤트로픽(Anthropic)과 미국 에너지부 산하 국가 핵안보국(NNSA, National Nuclear Security Administration)은 1년 넘는 협력을 거쳐, 핵 관련 대화를 정당한 연구와 위험 신호 대화로 구분하는 분류기를 공동 개발했다.

 

Anthropic 공식 블로그를 비롯해 FedScoop, The Hill, The Register, Axios, VKTR, FirstPost, SIPRI, Frontier Model Forum 등의 자료와 보도를 취합한 바에 따르면, 이 분류기는 AI 챗봇 클로드(Claude) 내에서 이미 실시간으로 동작 중이며, 핵무기 관련 위험 대화를 정확히 감별해 낸다.

 

앤트로픽은 300개 이상의 합성 테스트 문장을 통해 성능을 검증했는데, 핵무기 관련 질문을 94.8% 정확히 감지했고, 정상적인 연구 대화를 오탐하지 않는 데 100% 성공했다. 결과적으로 전체 정확도는 96.2%에 달한다.

 

정부와 민간의 협력으로 탄생한 기술적 진보


2024년 4월 시작된 이 협력은, NNSA가 기밀 환경에서 앤트로픽의 AI 모델을 대상으로 직접 레드팀 공격을 수행하며 위험 요소를 찾아내는 과정으로부터 출발했다. NNSA는 핵무기 개발과 무관한 핵 관련 대화—예를 들어 원자력 발전이나 의료 분야 대화—와 위험 신호로 여겨지는 대화를 나누기 위한 지표를 제공했다. 앤트로픽은 합성 데이터를 활용해 이들 지표를 기준으로 분류기의 정확도를 계속 개선했다.

 

실제 운용 과정에서 최근 중동 지역 긴장과 같은 국제 정세에 따른 무해한 핵무기 관련 시사 토론이 일부 오탐 사례로 분류되기도 했으나, 앤트로픽의 계층적 요약(Hierarchical Summarization) 시스템이 해당 대화를 정상적인 토론으로 재분류함으로써 오탐 문제를 최소화하고 있다.

 

산업계 전반 확대와 글로벌 AI 안전 기준 제시 방안


앤트로픽은 이번 핵안전 분류기술을 아마존, 메타, 오픈AI, 마이크로소프트, 구글 등이 참여하는 프런티어 모델 포럼(Frontier Model Forum)에 공유, AI 안전에 관한 새로운 표준 사례를 제시할 계획이다.

 

이미 자사 제품 전반에 화학, 생물학, 방사선, 핵무기 개발 관련 지식을 통한 악용을 명확히 금지하는 정책을 강화하고 있음을 밝혀, 민간 AI 산업 전체의 책임 있는 기술 개발과 규율 강화 추세에 부응하고 있다.

 

전문가들은 이번 협력이 AI의 산업적 발전과 국가안보 사이 중요한 균형을 보여주는 사례라 평가하며, 향후 다른 국가안보 분야의 AI 위험 대응 모델로도 확산될 수 있을 것으로 전망한다.

 

현재 AI 거버넌스 성숙도가 45%에 불과한 현실에서, 인간 전문가와 첨단 AI 기술의 융합을 통한 이 같은 선제적 위험 관리 노력은 매우 시의적절한 혁신으로 꼽힌다.

 

이번 앤트로픽-NNSA 협력은 AI 기술 발전의 이면에 도사린 국가 안보 위험을 효과적으로 관리하는 모델로 자리매김하며, AI 안전 기준과 글로벌 협력 강화에 기폭제 역할을 할 전망이다.

배너
배너
배너

관련기사

74건의 관련기사 더보기


[빅테크칼럼] TSMC CEO "테슬라와 인텔은 고객이자 경쟁자"…머스크의 테라팹이 흔드는 ‘파운드리 3강’ 질서

[뉴스스페이스=김정영 기자] TSMC C.C. 웨이 CEO가 2026년 1분기 실적 발표 콜에서 테슬라와 인텔을 동시에 “고객이자 경쟁자”로 지목하면서, 일론 머스크의 초대형 반도체 프로젝트 ‘테라팹(Terafab)’이 글로벌 파운드리 판도에 던지는 파장이 본격적으로 드러나고 있다. 웨이는 “파운드리 산업에는 지름길이 없다”며 기술·생산·신뢰를 3대 원칙으로 재확인했고, 머스크는 같은 시기 AI5 칩 테이프아웃 완료를 선언하며 TSMC·삼성·인텔을 아우르는 다중 파운드리·내재화 전략을 전면에 올렸다. TSMC “테슬라·인텔, 고객이자 동시에 경쟁자” 웨이 CEO는 실적 콜에서 JP모건 애널리스트의 질문에 답하며 “인텔과 테슬라는 모두 TSMC의 고객이자, 동시에 경쟁자”라고 규정했다. 특히 인텔에 대해서는 “formidable competitor(강력한 경쟁자)”라는 표현을 쓰며, 경쟁사이지만 결코 과소평가할 수 없는 존재임을 분명히 했다. 그는 파운드리 사업의 본질에 대해 “기술적 리더십, 우수한 제조 역량, 고객 신뢰라는 기본 원칙은 변한 적이 없다”고 강조하면서, 새로운 팹을 짓는 데만 2~3년, 양산 체제를 안정화하는 데 추가 1~2년이 걸린다고 설명

[빅테크칼럼] 엔비디아 젠슨 황 "앤트로픽 투자 기회 놓친 것은 내 실수"발언의 속셈?…GPU·풀스택 전략의 압도적 우위 자신감 '역설적 신호'

[뉴스스페이스=이현주 기자] 엔비디아 젠슨 황 CEO가 앤트로픽(Anthropic) 투자 초기 기회를 놓친 것을 두고 “내 실수(my miss)”라고 공개 인정했다는 사실은, 동시에 그가 여전히 자사 GPU·풀스택 전략의 압도적 우위를 자신하고 있다는 역설적인 신호이기도 하다. 황 CEO는 최근 드와르케시 파텔(Dwarkesh Patel)과의 팟캐스트 인터뷰에서 구글·AWS의 커스텀 AI 칩이 엔비디아 시장 지배력에 실질적 위협이 되느냐는 질문을 정면으로 받았다. 그는 “엔비디아보다 의미 있게 뛰어난 플랫폼을 만드는 것은 결코 쉬운 일이 아니다”라며, 경쟁 구도를 ‘성능·TCO·생태계’의 총합 싸움으로 재정의했다. 이 과정에서 가장 눈에 띄는 대목은 앤트로픽을 둘러싼 발언이다. 젠슨 황은 “앤트로픽이 없었다면 TPU 성장의 이유가 뭐가 되겠느냐, TPU 성장은 100% 앤트로픽 덕분”이라며, AWS의 Trainium 역시 “성장이 있다면 그것도 100% 앤트로픽”이라고 잘라 말했다. 국내외 매체 보도를 종합하면, 앤트로픽은 구글·브로드컴과 2027년부터 약 3.5GW 규모의 TPU 용량을 순차 공급받는 계약을 체결했으며, 구글과의 이전 계약에서는 최대 100