2026.03.04 (수)

  • 구름많음동두천 2.2℃
  • 흐림강릉 2.9℃
  • 구름많음서울 5.3℃
  • 맑음대전 5.6℃
  • 흐림대구 6.3℃
  • 맑음울산 5.1℃
  • 맑음광주 8.0℃
  • 맑음부산 6.1℃
  • 맑음고창 4.4℃
  • 흐림제주 10.1℃
  • 흐림강화 3.2℃
  • 구름많음보은 5.9℃
  • 맑음금산 5.9℃
  • 구름많음강진군 7.4℃
  • 흐림경주시 5.5℃
  • 맑음거제 5.7℃
기상청 제공

빅테크

[빅테크칼럼] AI가 핵무기 오용을 96%의 정확도로 감지한다고?…앤트로픽-美핵안보국 '맞손'

 

[뉴스스페이스=김정영 기자] 인공지능(AI) 분야에서 민간기업과 미국 정부가 손잡고 개발한 획기적인 AI 도구가, 핵무기 개발에 AI 챗봇이 악용되는 것을 96%의 정확도로 감지하는 데 성공했다.

 

인공지능 스타트업 앤트로픽(Anthropic)과 미국 에너지부 산하 국가 핵안보국(NNSA, National Nuclear Security Administration)은 1년 넘는 협력을 거쳐, 핵 관련 대화를 정당한 연구와 위험 신호 대화로 구분하는 분류기를 공동 개발했다.

 

Anthropic 공식 블로그를 비롯해 FedScoop, The Hill, The Register, Axios, VKTR, FirstPost, SIPRI, Frontier Model Forum 등의 자료와 보도를 취합한 바에 따르면, 이 분류기는 AI 챗봇 클로드(Claude) 내에서 이미 실시간으로 동작 중이며, 핵무기 관련 위험 대화를 정확히 감별해 낸다.

 

앤트로픽은 300개 이상의 합성 테스트 문장을 통해 성능을 검증했는데, 핵무기 관련 질문을 94.8% 정확히 감지했고, 정상적인 연구 대화를 오탐하지 않는 데 100% 성공했다. 결과적으로 전체 정확도는 96.2%에 달한다.

 

정부와 민간의 협력으로 탄생한 기술적 진보


2024년 4월 시작된 이 협력은, NNSA가 기밀 환경에서 앤트로픽의 AI 모델을 대상으로 직접 레드팀 공격을 수행하며 위험 요소를 찾아내는 과정으로부터 출발했다. NNSA는 핵무기 개발과 무관한 핵 관련 대화—예를 들어 원자력 발전이나 의료 분야 대화—와 위험 신호로 여겨지는 대화를 나누기 위한 지표를 제공했다. 앤트로픽은 합성 데이터를 활용해 이들 지표를 기준으로 분류기의 정확도를 계속 개선했다.

 

실제 운용 과정에서 최근 중동 지역 긴장과 같은 국제 정세에 따른 무해한 핵무기 관련 시사 토론이 일부 오탐 사례로 분류되기도 했으나, 앤트로픽의 계층적 요약(Hierarchical Summarization) 시스템이 해당 대화를 정상적인 토론으로 재분류함으로써 오탐 문제를 최소화하고 있다.

 

산업계 전반 확대와 글로벌 AI 안전 기준 제시 방안


앤트로픽은 이번 핵안전 분류기술을 아마존, 메타, 오픈AI, 마이크로소프트, 구글 등이 참여하는 프런티어 모델 포럼(Frontier Model Forum)에 공유, AI 안전에 관한 새로운 표준 사례를 제시할 계획이다.

 

이미 자사 제품 전반에 화학, 생물학, 방사선, 핵무기 개발 관련 지식을 통한 악용을 명확히 금지하는 정책을 강화하고 있음을 밝혀, 민간 AI 산업 전체의 책임 있는 기술 개발과 규율 강화 추세에 부응하고 있다.

 

전문가들은 이번 협력이 AI의 산업적 발전과 국가안보 사이 중요한 균형을 보여주는 사례라 평가하며, 향후 다른 국가안보 분야의 AI 위험 대응 모델로도 확산될 수 있을 것으로 전망한다.

 

현재 AI 거버넌스 성숙도가 45%에 불과한 현실에서, 인간 전문가와 첨단 AI 기술의 융합을 통한 이 같은 선제적 위험 관리 노력은 매우 시의적절한 혁신으로 꼽힌다.

 

이번 앤트로픽-NNSA 협력은 AI 기술 발전의 이면에 도사린 국가 안보 위험을 효과적으로 관리하는 모델로 자리매김하며, AI 안전 기준과 글로벌 협력 강화에 기폭제 역할을 할 전망이다.

배너
배너
배너

관련기사

65건의 관련기사 더보기


[빅테크칼럼] '美 클로드 AI 활용' 이란 공격에 中 '화들짝'…"AI 군사화 기술 자립 박차"

[뉴스스페이스=이승원 기자] 미군이 이란 공습에서 ‘AI 기반 표적식별·시나리오 시뮬레이션’까지 실전에 투입했다는 보도가 나오자, 중국 내부에서 “AI 군사화는 더는 선택이 아니라 기술 자립의 문제”라는 경계론이 급부상하고 있다. 동시에 트럼프 행정부가 구글·xAI·오픈AI 등과 국방 AI 도입을 확장하는 흐름이 맞물리며, 미·중 ‘국방 AI 생태계’ 격차가 지정학 리스크로 재부상하는 양상이다. SCMP(사우스차이나모닝포스트)는 "미군의 대이란 작전이 전자전(EW)·정보수집·AI 보조작전이 결합된 형태로 전개되며, 중국에 전자전·정보·AI 통합의 압박을 키웠다"고 전했다. 같은 보도에서 미군이 1,000개가 넘는 표적을 타격했다는 서술은, AI가 결합될 때 작전의 속도·규모가 비약적으로 커질 수 있음을 시사한다. 또 WSJ(월스트리트저널)를 인용한 해외 보도에 따르면 미 중부사령부(CENTCOM)는 앤트로픽의 ‘클로드(Claude)’를 활용해 영상·신호정보를 분석하고 표적 식별, 전투 시나리오 시뮬레이션까지 수행한 것으로 전해졌다. “미 국방-빅테크 결합”이 만든 격차 미 국방부는 구글·xAI·오픈AI·앤트로픽에 각각 최대 2억 달러 규모 계약을 부여해 국방

[The Numbers] 보스턴다이내믹스 100조 상장설, 정의선에 ‘20조 탄환’…현대차 순환출자 끊는 초대형 승계 시나리오

[뉴스스페이스=김정영 기자] 보스턴다이내믹스(BD)의 미국 상장(IPO)이 ‘로봇 빅딜’을 넘어 현대차그룹 지배구조 개편과 정의선 회장 승계 구도의 ‘게임 체인저’로 부상하고 있다. BD 상장 시계 빨라진 배경: 로봇·AI에서 재무 중심 회사로 올해 CES 2026에서 휴머노이드 ‘아틀라스(Atlas)’가 글로벌 주목을 받으면서 BD의 몸값은 단숨에 로봇·AI 대표주자로 격상됐다. BD는 그간 엔지니어·기술 중심 조직이었지만 최근 CEO가 기술통 로버트 플레이터에서 재무통인 어맨다 맥매스터 CFO(직무대행) 체제로 바뀌며, 상장을 전제로 한 ‘재무·수익 중심’ 회사로 선회하고 있다. 현대차그룹 내부에선 장재훈 부회장 직속 로보틱스·AI 전략 TFT를 신설하고, M&A·전략투자 인력을 전면 배치하며 BD를 축으로 한 로봇 포트폴리오 재편에 본격 나선 상태다. BD는 로봇 제어용 AI 소프트웨어 스타트업 ‘필드AI(Field AI)’에 수백만달러를 투입하고, 글로벌 AI·로보틱스 전문가 밀란 코박을 사외이사로 영입하는 등 상용화와 미국 IPO를 의식한 외연 확장에도 속도를 내고 있다. 업계와 증권가는 “2026년 상반기 나스닥 예비심사 청구·주관사 선정

[이슈&논란] 한국 시각장애 유튜버, 머스크의 뉴럴링크 임상실험에 공개 지원…“뇌에 칩 이식으로 다시 눈 뜰까”

[뉴스스페이스=김혜주 기자] 시각장애인 유튜버 ‘원샷한솔’(본명 김한솔·32)이 일론 머스크가 이끄는 뇌신경기술 스타트업 뉴럴링크의 시력 회복 프로젝트 ‘블라인드사이트(Blindsight)’ 임상시험에 직접 지원했다고 밝혀 국내외 의료·기술 커뮤니티에 주목을 받고 있다. 지난 2월 7일 유튜브 채널 ‘원샷한솔’에는 “미국 올 수 있냐길래 갈 수 있다고 해버렸다. 뇌에 칩 심는 임상실험(어그로 아님)”이라는 제목의 영상이 게재됐으며, 김한솔은 자신이 뉴럴링크의 블라인드사이트 임상시험에 참여 의사를 밝혔다고 공개했다. 김한솔은 시력 상실 이력과 관련해서 2010년 버스 통학 중 시력 이상을 감지한 뒤 약 2~3개월 만에 시력을 모두 잃었다고 소개하며, 현재는 시각장애인 유튜버로 160만명 수준의 구독자를 보유한 크리에이터로 활동 중이다. ​ 김한솔은 "눈이 보이는 게 아니라, 뇌가 보이게 하는 기술"이라고 해당 기술을 소개하며 "수술은 로봇이 하고 1시간 정도 걸린다고 들었다. 기술은 정말 좋지만, 나쁘게 쓰이면 무섭지 않겠나. 혹시 내 생각을 들여다보거나 해킹당할 수도 있는 것 아닌지 걱정도 된다"고 했다. 이어 "돈이 있는 사람만 눈을 뜨고, 돈이 없는 사람