2025.08.26 (화)

  • 구름많음동두천 29.3℃
  • 맑음강릉 33.1℃
  • 구름많음서울 29.7℃
  • 구름조금대전 30.6℃
  • 구름조금대구 30.8℃
  • 맑음울산 31.3℃
  • 구름조금광주 30.5℃
  • 맑음부산 31.2℃
  • 맑음고창 31.0℃
  • 맑음제주 31.5℃
  • 구름많음강화 28.8℃
  • 구름조금보은 27.9℃
  • 맑음금산 29.4℃
  • 구름조금강진군 30.8℃
  • 맑음경주시 31.7℃
  • 구름조금거제 30.6℃
기상청 제공

빅테크

[빅테크칼럼] AI가 핵무기 오용을 96%의 정확도로 감지한다고?…앤트로픽-美핵안보국 '맞손'

 

[뉴스스페이스=김정영 기자] 인공지능(AI) 분야에서 민간기업과 미국 정부가 손잡고 개발한 획기적인 AI 도구가, 핵무기 개발에 AI 챗봇이 악용되는 것을 96%의 정확도로 감지하는 데 성공했다.

 

인공지능 스타트업 앤트로픽(Anthropic)과 미국 에너지부 산하 국가 핵안보국(NNSA, National Nuclear Security Administration)은 1년 넘는 협력을 거쳐, 핵 관련 대화를 정당한 연구와 위험 신호 대화로 구분하는 분류기를 공동 개발했다.

 

Anthropic 공식 블로그를 비롯해 FedScoop, The Hill, The Register, Axios, VKTR, FirstPost, SIPRI, Frontier Model Forum 등의 자료와 보도를 취합한 바에 따르면, 이 분류기는 AI 챗봇 클로드(Claude) 내에서 이미 실시간으로 동작 중이며, 핵무기 관련 위험 대화를 정확히 감별해 낸다.

 

앤트로픽은 300개 이상의 합성 테스트 문장을 통해 성능을 검증했는데, 핵무기 관련 질문을 94.8% 정확히 감지했고, 정상적인 연구 대화를 오탐하지 않는 데 100% 성공했다. 결과적으로 전체 정확도는 96.2%에 달한다.

 

정부와 민간의 협력으로 탄생한 기술적 진보


2024년 4월 시작된 이 협력은, NNSA가 기밀 환경에서 앤트로픽의 AI 모델을 대상으로 직접 레드팀 공격을 수행하며 위험 요소를 찾아내는 과정으로부터 출발했다. NNSA는 핵무기 개발과 무관한 핵 관련 대화—예를 들어 원자력 발전이나 의료 분야 대화—와 위험 신호로 여겨지는 대화를 나누기 위한 지표를 제공했다. 앤트로픽은 합성 데이터를 활용해 이들 지표를 기준으로 분류기의 정확도를 계속 개선했다.

 

실제 운용 과정에서 최근 중동 지역 긴장과 같은 국제 정세에 따른 무해한 핵무기 관련 시사 토론이 일부 오탐 사례로 분류되기도 했으나, 앤트로픽의 계층적 요약(Hierarchical Summarization) 시스템이 해당 대화를 정상적인 토론으로 재분류함으로써 오탐 문제를 최소화하고 있다.

 

산업계 전반 확대와 글로벌 AI 안전 기준 제시 방안


앤트로픽은 이번 핵안전 분류기술을 아마존, 메타, 오픈AI, 마이크로소프트, 구글 등이 참여하는 프런티어 모델 포럼(Frontier Model Forum)에 공유, AI 안전에 관한 새로운 표준 사례를 제시할 계획이다.

 

이미 자사 제품 전반에 화학, 생물학, 방사선, 핵무기 개발 관련 지식을 통한 악용을 명확히 금지하는 정책을 강화하고 있음을 밝혀, 민간 AI 산업 전체의 책임 있는 기술 개발과 규율 강화 추세에 부응하고 있다.

 

전문가들은 이번 협력이 AI의 산업적 발전과 국가안보 사이 중요한 균형을 보여주는 사례라 평가하며, 향후 다른 국가안보 분야의 AI 위험 대응 모델로도 확산될 수 있을 것으로 전망한다.

 

현재 AI 거버넌스 성숙도가 45%에 불과한 현실에서, 인간 전문가와 첨단 AI 기술의 융합을 통한 이 같은 선제적 위험 관리 노력은 매우 시의적절한 혁신으로 꼽힌다.

 

이번 앤트로픽-NNSA 협력은 AI 기술 발전의 이면에 도사린 국가 안보 위험을 효과적으로 관리하는 모델로 자리매김하며, AI 안전 기준과 글로벌 협력 강화에 기폭제 역할을 할 전망이다.

배너
배너
배너

관련기사

18건의 관련기사 더보기


[빅테크칼럼] 전신마비 남성, 뉴럴링크 뇌 칩으로 ‘인생 재설계’…대학생·사업가로 변신한 미래의 사이보그

[뉴스스페이스=이은주 기자] 18개월 전 수영 사고로 어깨 아래가 완전히 마비됐던 애리조나에 거주하는 29세의 놀랜드 아르보(Noland Arbaugh) 씨가 일론 머스크가 이끄는 뉴럴링크(Neuralink)의 뇌-컴퓨터 인터페이스(BCI) 뇌 칩 이식 수술로 삶을 완전히 바꿔놓았다. 2024년 1월 아르바우는 뉴럴링크의 임플란트를 처음으로 인간에게 이식받은 사례가 됐으며, 현재는 컴퓨터와 가전제품을 생각만으로 제어하고 비디오 게임을 즐기는 대학생이자 사업가로 거듭났다. 뉴럴링크의 공식발표와 포춘(Fortune)지와의 인터뷰에 따르면 이 기기는 그의 삶을 근본적으로 바꿔놓았다. 아르보는 이제 하루 최대 10시간 동안 임플란트를 사용해 컴퓨터를 제어하고, 마리오 카트(Mario Kart)를 비롯한 비디오 게임을 하며, 텔레비전이나 공기청정기 같은 가전제품을 생각만으로 관리하고 있다. 뉴럴링크 임플란트는 그의 운동 피질에 1000개 이상의 전극을 연결하여 뇌 신호를 분석, 디지털 기기를 조작할 수 있게 한다. 아르바우는 현재 하루 최대 10시간 이 장치를 활용하며, 아리조나 커뮤니티 칼리지에서 신경과학 전공을 위한 예비 과목을 수강 중이다. 그는 “내 삶에 다시

[빅테크칼럼] 삼성전자·존스홉킨스大 “공학의 노벨상 품었다”… 차세대 펠티어 냉각 기술, 세계 100대 혁신 기술에 선정

[뉴스스페이스=김정영 기자] 삼성전자와 미국 존스홉킨스대학교 응용물리학연구소가 공동 개발한 차세대 펠티어 냉각 기술이 2025년 ‘R&D 100 어워드’에서 세계 100대 혁신 기술로 선정됐다. 1963년 제정된 이 상은 ‘공학의 노벨상’, ‘산학 혁신의 오스카상’으로 불리며, 매년 과학기술 분야에서 실용성과 혁신성을 겸비한 100대 기술을 엄선한다. 이번 수상은 삼성 연구진과 글로벌 산학 협력의 우수성을 다시 한번 증명했다. 이번 기술은 기존 냉매 기반 냉각 방식의 한계를 뛰어넘는 친환경 고효율 반도체 박막 펠티어 소자를 최초로 개발한 점에서 높은 평가를 받았다. 나노공학 기반의 ‘CHESS’ 박막 소재를 활용, 냉매 대신 전기만으로 냉각을 구현하면서 기존 대비 약 75% 냉각 효율을 향상시켰다. 또한, 소형화와 경량화 효과로 소재 사용량을 1/1000 수준으로 줄여 생산 비용과 환경 영향을 대폭 감소시켰다. 펠티어 기술은 전류가 흐르는 반도체 소자의 한 쪽은 냉각되고 다른 쪽은 발열하는 원리를 활용한 친환경 냉각 방식이다. 전통적 냉매를 사용하지 않아 글로벌 환경규제 강화에 따른 대체 기술 수요에 부합하며, 빠르고 정밀한 온도 제어가 가능해 가전,