2026.02.16 (월)

  • 구름많음동두천 -1.2℃
  • 맑음강릉 5.3℃
  • 구름많음서울 -0.1℃
  • 맑음대전 -0.9℃
  • 구름많음대구 6.1℃
  • 맑음울산 6.9℃
  • 구름많음광주 1.1℃
  • 맑음부산 9.4℃
  • 구름많음고창 -2.7℃
  • 맑음제주 6.3℃
  • 흐림강화 -0.4℃
  • 맑음보은 -3.8℃
  • 구름많음금산 -2.9℃
  • 구름많음강진군 2.4℃
  • 구름많음경주시 5.9℃
  • 맑음거제 7.3℃
기상청 제공

빅테크

[빅테크칼럼] 아마존, AI 학습 데이터에서 아동 학대물 발견… AI 훈련 데이터셋 오염 문제 '부각'

 

[뉴스스페이스=윤슬 기자] 아마존은 지난해 인공지능 모델 학습을 위해 수집한 데이터에서 발견된 수십만건의 아동 성 학대 이미지 의심 사례를 신고했으며, 이는 2025년 실종 및 학대아동 보호센터(NCMEC)가 접수한 100만건 이상의 AI 관련 신고 중 대부분을 차지했다.

 

블룸버그가 28일(현지시간) 보도한 바에 따르면, NCMEC에 접수된 AI 관련 신고가 전년 대비 15배 급증했으며, 아마존의 신고가 이러한 증가의 압도적 다수를 차지했다. 아마존은 모델 학습에 사용하기 전에 해당 콘텐츠를 제거했다고 밝혔지만, 아동 안전 당국은 자료의 출처에 대한 중요한 세부 정보가 부족해 아동 보호에 거의 도움이 되지 않는다고 비판했다.

 

bloomberg, cyberlaw.stanford, aboutamazon, gigazine, factually에 따르면, 아마존은 2025년 상반기 AI 모델 훈련 데이터에서 확인된 알려진 아동 성학대물(CSAM) 38만건을 NCMEC에 신고했으나, 출처 정보 부재로 대부분 '조치 불가능' 판정을 받았다. 이는 전년 전체 6만7000건에서 15배 이상 폭증한 100만건 이상 AI 관련 신고 중 압도적 비중을 차지하며, 업계 스캔 관행의 허점을 드러냈다.

 

신고 규모와 폭증 배경


NCMEC은 2025년 AI 관련 CSAM 신고를 100만건 이상 접수했으며, 이 중 아마존이 '대부분'을 담당했다. 특히 상반기 48만5000건 중 아마존 38만건(78% 비중)은 해시 매칭으로 확인된 기존 피해자 CSAM이었고, AI 생성물은 '제로'였다. 2024년 아마존 총 신고는 6만4,195건에 불과했으나, AI 개발 가속화로 급증한 것이다.

 

아마존은 "과도하게 포괄적 스캔 임계값으로 99.97%가 비독점 데이터 오탐지"라며 "모델 학습 전 제거했다"고 해명했다. 그러나 NCMEC 사이버팁라인 상임이사 팰런 맥널티는 "아마존 상황이 이례적"이라며, "콘텐츠 출처·공유자·온라인 가용성 정보가 없어 법 집행 지원이 불가능하다"고 비판했다.

경쟁사 대비 '작은 물량'의 질적 우위


구글, 메타, 오픈AI, 앤트로픽 등은 AI 훈련 데이터 스캔을 실시하나, 아마존 제외 업계 신고는 "정말 소량"으로 핵심 세부사항을 포함해 실행 가능했다. 오픈AI는 2025 상반기 NCMEC에 다수 CSAM·아동 착취 건을 보완 보고하며 투명성을 강조했다. 이는 아마존의 '대량 무정보 신고'와 대조되며, NCMEC이 아마존에 개선을 촉구한 배경이다.

 

스탠포드 인터넷 관측소 데이비드 틸 전 CTO는 "모델 훈련 데이터 수집·분석 과정 투명성 강화 필요"라고 지적했다. Thorn 데이터 과학자 데이비드 러스트-스미스는 "인터넷 대량 수집 시 CSAM 불가피"라며, 최근 데이터 정리 경쟁을 꼬집었다.

산업 함의와 규제 과제


이 사건은 AI 훈련 데이터셋 오염 문제를 부각시키며, NCMEC CyberTipline 양식 개편 요구를 촉발했다. 'Generative AI' 체크박스 모호성으로 6개월간 AI 생성 CSAM 폭증 오인됐으나, 실제 아마존 신고는 기존 CSAM 스캔 결과였다. 전문가들은 데이터 소싱 책임 강화와 NCMEC 보고 형식 세분화를 촉구 중이다.

 

아마존은 2026년 1월 기준 "모델이 CSAM 생성 사례 없음"을 강조하나, 대량 신고가 자사 탐지 우수성을 시사할지 여부는 논란이다. 업계는 2024년 '생성 AI 아동 학대 방지 원칙' 준수(구글·메타·오픈AI 등 서명)를 강화하며 대응 중이다.

배너
배너
배너

관련기사

87건의 관련기사 더보기


[빅테크칼럼] 죽은 뒤에도 인스타에 댓글 단다?… 메타의 ‘디지털 사후 아바타’ 특허가 던진 불편한 미래

[뉴스스페이스=김정영 기자] 메타 플랫폼스가 사용자 사망 후에도 소셜 미디어 계정을 활성 상태로 유지할 수 있는 인공지능 기술 특허를 취득했다. 이 기술은 사용자의 과거 게시물과 상호작용을 대규모 언어 모델에 학습시켜 온라인 행동을 무기한으로 시뮬레이션할 수 있다. 이 인공지능(AI) 기술에 대해 미국 특허를 취득하면서, 이른바 ‘디지털 사후세계(digital afterlife)’ 시장과 규제 논쟁이 동시에 달아오르고 있다. Business Insider가 처음 보도한 이 특허는 2025년 12월 말에 승인됐으며, 사용자가 부재 중일 때, 사망 후를 포함해 페이스북, 인스타그램, 왓츠앱과 같은 플랫폼에서 AI가 사용자의 활동을 "시뮬레이션"할 수 있는 시스템이다. 메타의 최고기술책임자(CTO)인 앤드류 보스워스가 이 특허의 주요 저자로 명시되어 있으며, 이 특허는 원래 2023년에 출원됐다. 메타는 특허 문서에서 “해당 사용자가 사망하여 소셜 네트워킹 플랫폼에 영원히 돌아올 수 없다면, 그 사용자를 팔로우하던 다른 사용자에게 미치는 영향은 훨씬 더 심각하고 영구적”이라며, ‘부재’가 가져오는 공백을 AI가 메워줄 수 있다는 논리를 제시했다. 하지만 논란이 급