2025.10.15 (수)

  • 흐림동두천 15.1℃
  • 흐림강릉 15.7℃
  • 흐림서울 16.5℃
  • 흐림대전 19.4℃
  • 흐림대구 19.1℃
  • 흐림울산 19.5℃
  • 흐림광주 22.1℃
  • 흐림부산 21.7℃
  • 구름많음고창 23.2℃
  • 맑음제주 26.3℃
  • 흐림강화 15.4℃
  • 흐림보은 18.0℃
  • 구름많음금산 19.7℃
  • 흐림강진군 23.0℃
  • 흐림경주시 18.6℃
  • 흐림거제 21.8℃
기상청 제공

빅테크

[빅테크칼럼] AI가 핵무기 오용을 96%의 정확도로 감지한다고?…앤트로픽-美핵안보국 '맞손'

 

[뉴스스페이스=김정영 기자] 인공지능(AI) 분야에서 민간기업과 미국 정부가 손잡고 개발한 획기적인 AI 도구가, 핵무기 개발에 AI 챗봇이 악용되는 것을 96%의 정확도로 감지하는 데 성공했다.

 

인공지능 스타트업 앤트로픽(Anthropic)과 미국 에너지부 산하 국가 핵안보국(NNSA, National Nuclear Security Administration)은 1년 넘는 협력을 거쳐, 핵 관련 대화를 정당한 연구와 위험 신호 대화로 구분하는 분류기를 공동 개발했다.

 

Anthropic 공식 블로그를 비롯해 FedScoop, The Hill, The Register, Axios, VKTR, FirstPost, SIPRI, Frontier Model Forum 등의 자료와 보도를 취합한 바에 따르면, 이 분류기는 AI 챗봇 클로드(Claude) 내에서 이미 실시간으로 동작 중이며, 핵무기 관련 위험 대화를 정확히 감별해 낸다.

 

앤트로픽은 300개 이상의 합성 테스트 문장을 통해 성능을 검증했는데, 핵무기 관련 질문을 94.8% 정확히 감지했고, 정상적인 연구 대화를 오탐하지 않는 데 100% 성공했다. 결과적으로 전체 정확도는 96.2%에 달한다.

 

정부와 민간의 협력으로 탄생한 기술적 진보


2024년 4월 시작된 이 협력은, NNSA가 기밀 환경에서 앤트로픽의 AI 모델을 대상으로 직접 레드팀 공격을 수행하며 위험 요소를 찾아내는 과정으로부터 출발했다. NNSA는 핵무기 개발과 무관한 핵 관련 대화—예를 들어 원자력 발전이나 의료 분야 대화—와 위험 신호로 여겨지는 대화를 나누기 위한 지표를 제공했다. 앤트로픽은 합성 데이터를 활용해 이들 지표를 기준으로 분류기의 정확도를 계속 개선했다.

 

실제 운용 과정에서 최근 중동 지역 긴장과 같은 국제 정세에 따른 무해한 핵무기 관련 시사 토론이 일부 오탐 사례로 분류되기도 했으나, 앤트로픽의 계층적 요약(Hierarchical Summarization) 시스템이 해당 대화를 정상적인 토론으로 재분류함으로써 오탐 문제를 최소화하고 있다.

 

산업계 전반 확대와 글로벌 AI 안전 기준 제시 방안


앤트로픽은 이번 핵안전 분류기술을 아마존, 메타, 오픈AI, 마이크로소프트, 구글 등이 참여하는 프런티어 모델 포럼(Frontier Model Forum)에 공유, AI 안전에 관한 새로운 표준 사례를 제시할 계획이다.

 

이미 자사 제품 전반에 화학, 생물학, 방사선, 핵무기 개발 관련 지식을 통한 악용을 명확히 금지하는 정책을 강화하고 있음을 밝혀, 민간 AI 산업 전체의 책임 있는 기술 개발과 규율 강화 추세에 부응하고 있다.

 

전문가들은 이번 협력이 AI의 산업적 발전과 국가안보 사이 중요한 균형을 보여주는 사례라 평가하며, 향후 다른 국가안보 분야의 AI 위험 대응 모델로도 확산될 수 있을 것으로 전망한다.

 

현재 AI 거버넌스 성숙도가 45%에 불과한 현실에서, 인간 전문가와 첨단 AI 기술의 융합을 통한 이 같은 선제적 위험 관리 노력은 매우 시의적절한 혁신으로 꼽힌다.

 

이번 앤트로픽-NNSA 협력은 AI 기술 발전의 이면에 도사린 국가 안보 위험을 효과적으로 관리하는 모델로 자리매김하며, AI 안전 기준과 글로벌 협력 강화에 기폭제 역할을 할 전망이다.

배너
배너
배너

관련기사

27건의 관련기사 더보기


[이슈&논란] "12월부터 챗GPT, 성인용 대화 허용"…오픈AI, 정신건강 제한 완화로 사용자경험 강화

[뉴스스페이스=김정영 기자] 오픈AI가 오는 12월부터 챗GPT에서 연령 인증을 거친 성인 이용자에 한해 성적인 대화 및 성인용 콘텐츠 이용을 허용하는 정책 전환을 예고했다. 로이터, CNBC, BBC, TechCrunch에 따르면, 샘 올트먼 오픈AI 최고경영자(CEO)는 10월 14일(현지시간) 소셜미디어 엑스(X)를 통해 새로운 챗GPT 버전을 출시할 계획을 밝히며, “성인 이용자는 성인답게 대할 것”이라는 원칙하에 "성애 콘텐츠(erotica) 등 훨씬 더 다양한 내용을 제공할 예정"이라고 밝혔다. 그는 “그간 챗GPT는 정신건강 문제 우려로 인해 상당히 제한적으로 설계돼 정신건강 문제가 없는 많은 이용자들에게 덜 유용하고 재미없게 느껴지는 측면이 있었다”고 설명하며, “최근 정신건강 문제에 효과적으로 대응할 도구들을 확보해 대부분의 경우에서 이러한 제한을 안전하게 완화할 수 있게 됐다”고 덧붙였다. 이번 정책 변화는 신규 도구와 연령 인증 시스템 도입에 힘입어 이뤄지며, 미성년자에게는 여전히 엄격한 콘텐츠 필터링과 별도의 아동용 챗GPT 환경이 적용된다. 오픈AI는 9월부터 이미 미성년자용 챗GPT를 별도로 구현해 자동으로 연령별 적합한 환경을 안내

[빅테크칼럼] 글로벌자산 토큰화 혁명, 5년 내 전통금융·암호화폐 경계 붕괴…로빈후드·월가 ‘블록체인 미래’ 가세

[뉴스스페이스=이은주 기자] 미국 온라인 증권 플랫폼 로빈후드의 블라드 테네프 CEO가 “토큰화는 멈출 수 없는 화물열차처럼 전 세계 금융시스템을 삼키게 될 것”이라고 단언했다. 지난 10월 2일 싱가포르 암호화폐 콘퍼런스 패널 토론에서 그는 “앞으로 5년 이내 주요 금융시장이 디지털 자산 거래의 제도적 기반을 마련할 것”이라며, “완전한 100% 전환까지는 10년 이상 소요될 수도 있으나, 미국은 기존 인프라의 고착성 때문에 마지막에 전면 도입할 가능성이 크다”고 밝혔다.​ 토큰화: 실물자산의 블록체인 전환 가속화 자산 토큰화란 주식, 채권, 부동산 등 실물자산을 블록체인이나 분산원장에 기록해 디지털 증권 형태로 투자, 거래하는 기술이다. 최근 들어 월가의 대형 금융기관, 글로벌 자산운용사들이 실물자산 토큰화 도입에 박차를 가하고 있다. 모건스탠리, 블랙록 등도 관련 사업을 강화하며 “디지털 실물자산 시장” 공략에 나서고 있고, KPMG가 올해 발표한 ‘2025 글로벌 자산 토큰화 보고서’에 따르면 2024년 기준 토큰화 자산 시장 규모는 3500억 달러에 달한다. 2030년에는 16조 달러로, 글로벌 시가총액의 10%에 육박할 것으로 전망했다.​ 로빈후드