
[뉴스스페이스=김정영 기자] 오픈AI가 2025년 7월 '챗GPT Agent'를 전 세계에 공개하며 유례없는 수준의 생물학·화학적 위험 가능성을 공식 경고했다.
이 제품은 오픈AI가 자사 모델 중 처음으로 '높은(bio-high)' 위험 등급을 매긴 인공지능으로, 실제로 '초보' 수준의 사용자가 알려진 생화학 무기를 모방·제작하는 데 의미 있는 도움을 줄 수 있다는 점이 공식화됐다.
오픈AI CEO 샘 올트먼은 "(챗GPT Agent는) 여전히 실험적 기술이며, 악의적 행위자가 AI를 속여 사적인 정보를 유출하게 하거나 예측하기 어려운 형태로 해를 끼칠 위험이 있다"고 경고했다. 실제로 챗GPT Agent는 사용자의 가상 컴퓨터를 제어해 파일 탐색, 데이터 분석, 프레젠테이션 생성, 심지어 웹 브라우저와 애플리케이션을 능동적으로 조작할 수 있는, 기존 챗봇과는 차원이 다른 '에이전트형 AI'다.
기존 모델 넘는 '생물무기 위험', 첫 공식 고위험 등급 지정
오픈AI가 마련한 'Preparedness Framework(대비 프레임워크)'에 의해, 이번 챗GPT Agent는 그 위험성을 근거로 최대 수준의 보안 장치를 적용받았다. 실제로 올해 발표된 국제 AI 안전보고서에 따르면, 최신 LLM(대형언어모델)의 생물학 및 화학 무기 조작성 응답 능력이 1년 만에 80% 가까이 상승한 것으로 평가됐다.
오픈AI 내부 및 외부 전문가 평가는 이 모델이 "기존 인터넷 검색만으로는 접근이 어려운 핵심정보를 제공해 줄 수 있다"고 결론냈다.
SecureBio AI 그룹 실험에서 챗GPT Agent는 'World-Class Biology' 평가에서 기존 모델(o3)의 정답률(1.5/10)보다 두 배 넘는 4/10을 기록했다. 병원체 획득 시나리오 평가에서도 기존 AI가 흔히 범하는 오류를 챗GPT Agent가 우회하는 데 성공했다는 사실이 공개됐다.
오픈AI의 내부 적색팀은 110개의 공격 시도(프롬프트 인젝션, 생물 정보 추출 등) 중 16개가 내부 위험 기준치를 넘었다고 밝혔으며, Agent 전용 95% 대응 방어 체계를 도입했다.
"AI로 초보자도 생물무기 설계 곧 가능"…국가·사회적 대응 시급
기존 생물무기의 현실적 위협을 높였던 것은 문턱 높은 전문지식, 실험실 접근, 실질적 합성기술 부족 등이었다. 그러나 전문가들은 "AI 기반 도구가 생물학 연구의 '설계-테스트-수정' 루프를 수 시간 만에 재현해, 초보자도 그 간극을 좁힐 수 있게 만든다"고 경고한다.
오픈AI는 "아직 완전히 새로운 생화학 위협을 만들어내는 단계는 아니다"라고 강조했지만, '노비스 업리프트(Novice Uplift, 비전문가로 하여금 실질적 위해를 실현하도록 돕는 AI의 능력)'이 곧 현실화될 것으로 보인다.
국제기구 보고서는 AI 기반 바이오테러 공격 실행 지침 정확도가 2024년 한 해 동안 80% 가까이 향상됐다고 밝히며, 이 위험성을 특히 강조했다.
오픈AI는 전 세계 4억명 이상이 주간 단위로 챗GPT에 접속하고, 300만명 이상의 개발자가 API를 활용 중이라고 설명했다. 이처럼 대규모 배포 환경은 위험 시나리오의 현실화 확률도 높인다.
강화된 안전장치, 실제 효과는?
오픈AI는 초고위험 지정과 함께 다음과 같은 다층 보안책을 도입했다. 우선 생화학무기, 은행사기 등 위험성 프롬프트에 대해 학습 기반 즉시 거부 시스템인 거부 훈련(Refusal Training)을 적용했다. 둘째는 Agent가 수행하는 행동의 실시간 감시와 이상 징후 즉각 차단위한 상시 모니터링체제의 도입이다.
셋째는 실시간 사용자 승인, 메일 전송·은행 업무 등은 반드시 추가 확인하는 등 고위험 태스크의 경우 이중 확인을 일반화했다. 넷째는 생물안보 전문가·정부기관과 상시 고위험 시나리오를 점검하고, 외부 적색팀과 항시 테스트가 가능한 협력체계도 구축했다.
그러나 국제 보안 전문가들은 "오픈AI 등 일부 기업은 사회적 책임감을 가지고 (정보 제공) 차단책을 강화하고 있지만, 일부 신생 AI 업체는 아직도 VX·타분(TABUN) 등 치명적 물질 합성법을 AI가 직접 안내하는 사례가 있다"고 경고했다.
AI의 진화와 위험, 이제는 실질적인 대응이 필요하다
AI 사회 진입이 본격화되는 2025년, '인공지능판 판도라의 상자'가 실제 열리고 있다. 오픈AI는 이번 챗GPT Agent 출시와 함께 전례 없는 주의 경보를 발령했으나, model로서의 파급효과가 글로벌 모든 AI산업으로 빠르게 전이되고 있음을 널리 알렸다.
현실적으로 '노비스 업리프트' 현상, 즉 초보자의 고위험 악성 행위 실현력을 높여주는 AI의 시대가 임박하면서, 국가 및 산업계, 연구기관의 실질적 공조와 투명한 리스크 공개, 국제규범 제정이 시급함을 더욱 절감케 한다.
AI‧보안 전문가들은 "임계점이 도래한 AI 위험성 앞에, 결국 인류의 집단적 대응과 바이오안보 거버넌스가 절실하다"고 경고했다.