[빅테크칼럼] 아마존, AI 학습 데이터에서 아동 학대물 발견… AI 훈련 데이터셋 오염 문제 '부각'

아마존은 지난해 인공지능 모델 학습을 위해 수집한 데이터에서 발견된 수십만건의 아동 성 학대 이미지 의심 사례를 신고했으며, 이는 2025년 실종 및 학대아동 보호센터(NCMEC)가 접수한 100만건 이상의 AI 관련 신고 중 대부분을 차지했다. / gigazine.net

[뉴스스페이스=이종화 기자] 아마존은 지난해 인공지능 모델 학습을 위해 수집한 데이터에서 발견된 수십만건의 아동 성 학대 이미지 의심 사례를 신고했으며, 이는 2025년 실종 및 학대아동 보호센터(NCMEC)가 접수한 100만건 이상의 AI 관련 신고 중 대부분을 차지했다.

블룸버그가 28일(현지시간) 보도한 바에 따르면, NCMEC에 접수된 AI 관련 신고가 전년 대비 15배 급증했으며, 아마존의 신고가 이러한 증가의 압도적 다수를 차지했다. 아마존은 모델 학습에 사용하기 전에 해당 콘텐츠를 제거했다고 밝혔지만, 아동 안전 당국은 자료의 출처에 대한 중요한 세부 정보가 부족해 아동 보호에 거의 도움이 되지 않는다고 비판했다.

bloomberg, cyberlaw.stanford, aboutamazon, gigazine, factually에 따르면, 아마존은 2025년 상반기 AI 모델 훈련 데이터에서 확인된 알려진 아동 성학대물(CSAM) 38만건을 NCMEC에 신고했으나, 출처 정보 부재로 대부분 '조치 불가능' 판정을 받았다. 이는 전년 전체 6만7000건에서 15배 이상 폭증한 100만건 이상 AI 관련 신고 중 압도적 비중을 차지하며, 업계 스캔 관행의 허점을 드러냈다.

신고 규모와 폭증 배경

NCMEC은 2025년 AI 관련 CSAM 신고를 100만건 이상 접수했으며, 이 중 아마존이 '대부분'을 담당했다. 특히 상반기 48만5000건 중 아마존 38만건(78% 비중)은 해시 매칭으로 확인된 기존 피해자 CSAM이었고, AI 생성물은 '제로'였다. 2024년 아마존 총 신고는 6만4,195건에 불과했으나, AI 개발 가속화로 급증한 것이다.

아마존은 "과도하게 포괄적 스캔 임계값으로 99.97%가 비독점 데이터 오탐지"라며 "모델 학습 전 제거했다"고 해명했다. 그러나 NCMEC 사이버팁라인 상임이사 팰런 맥널티는 "아마존 상황이 이례적"이라며, "콘텐츠 출처·공유자·온라인 가용성 정보가 없어 법 집행 지원이 불가능하다"고 비판했다.

경쟁사 대비 '작은 물량'의 질적 우위

구글, 메타, 오픈AI, 앤트로픽 등은 AI 훈련 데이터 스캔을 실시하나, 아마존 제외 업계 신고는 "정말 소량"으로 핵심 세부사항을 포함해 실행 가능했다. 오픈AI는 2025 상반기 NCMEC에 다수 CSAM·아동 착취 건을 보완 보고하며 투명성을 강조했다. 이는 아마존의 '대량 무정보 신고'와 대조되며, NCMEC이 아마존에 개선을 촉구한 배경이다.

스탠포드 인터넷 관측소 데이비드 틸 전 CTO는 "모델 훈련 데이터 수집·분석 과정 투명성 강화 필요"라고 지적했다. Thorn 데이터 과학자 데이비드 러스트-스미스는 "인터넷 대량 수집 시 CSAM 불가피"라며, 최근 데이터 정리 경쟁을 꼬집었다.

산업 함의와 규제 과제

이 사건은 AI 훈련 데이터셋 오염 문제를 부각시키며, NCMEC CyberTipline 양식 개편 요구를 촉발했다. 'Generative AI' 체크박스 모호성으로 6개월간 AI 생성 CSAM 폭증 오인됐으나, 실제 아마존 신고는 기존 CSAM 스캔 결과였다. 전문가들은 데이터 소싱 책임 강화와 NCMEC 보고 형식 세분화를 촉구 중이다.

아마존은 2026년 1월 기준 "모델이 CSAM 생성 사례 없음"을 강조하나, 대량 신고가 자사 탐지 우수성을 시사할지 여부는 논란이다. 업계는 2024년 '생성 AI 아동 학대 방지 원칙' 준수(구글·메타·오픈AI 등 서명)를 강화하며 대응 중이다.

빅테크

[빅테크칼럼] 아마존, AI 학습 데이터에서 아동 학대물 발견… AI 훈련 데이터셋 오염 문제 '부각'

관련기사

이 시각 추천뉴스

[랭킹연구소] TIME, 2026년 ‘가장 영향력 있는 교육 기업’ 10곳의 민낯…칸아카데미>퀴즐렛>매직스쿨AI>에펙타>칼리지보드>스쿼럴AI>코드닷오르그>코세라>굿윌 인더스트리얼 인터내셔널>터니틴 順

[빅테크칼럼] 챗GPT ‘삭제 413% 폭증’…오픈AI, IPO 앞두고 드러난 성장 피로와 리스크 지도

[빅테크칼럼] AI 시스템, 눈 사진 한 장으로 6가지 질환 선별…AI 안구오믹스 시대 열리나

[빅테크칼럼] 왜 골드만삭스는 홍콩뱅커들에게 앤트로픽을 차단했을까?…금융허브 홍콩 AI전략과 미중 전쟁의 지정학적 교차점

[빅테크칼럼] AI가 얼굴 노화 속도로 암 생존율 예측...2년 간격 사진 분석시 정확도 급상승

[빅테크칼럼] “인간이 꾼 꿈, AI가 해독한다”...정신질환 징후·약물치료 효과 모니터링 통한 '정신건강 조기 경보 시스템' 될까

[랭킹연구소] TIME誌 선정 인공지능 분야 TOP 10 "中 3곳, 美 6곳, EU 1곳"… 오픈AI·알파벳(구글)·아마존·메타·앤트로픽·미스트랄 AI·허깅페이스·바이트댄스·알리바바·즈푸 AI

[빅테크칼럼] 오픈AI 악재로 기술주 급락…신흥시장 랠리 꺾은 두 개의 공포 “AI의 제동, 이란의 불씨”

[빅테크칼럼] 펜실베이니아주립大, 복근이 뇌의 수압 펌프 역할 …"걷기만 해도 뇌 속 노폐물 씻어내는 ‘유압 펌프’ 있었다"

많이 본 뉴스

[빅테크칼럼] AI가 열어젖힌 ‘1인 유니콘’ 신화 '메드비(Medvi)'…"단 2명 회사, 연매출 2조원"

[빅테크칼럼] AI, 인간 수학자의 ‘성역’ 넘봤나… GPT-5.4의 '에르되시 난제' 해결 주장의 실체

[이슈&논란] "조합장 해임 총회 오시면 프라이팬 드려요"…DL이앤씨, 상대원2구역 매표 행위에 '조합원들 뿔났다'

[The Numbers] 일룸, 실적 '반토막'에도 지주사 신설 직후 15억 중간배당… 대만법인 부실에 자본잠식·내부거래·고배당·소송까지 '첩첩산중'

[랭킹연구소] 한국 기업 매출 순위 TOP10…삼성전자>한국전력>SK하이닉스>현대차>기아>현대모비스>한국가스공사>에쓰오일>삼성생명>LG전자 順

[The Numbers] 자코모, 1000억 매출에 수익성 '급전직하', 차입금 급증·특수관계자 거래 '경고등'…누적결손 40억·부채비율 2826%에 자본잠식 '우려'

[The Numbers] 프레인글로벌, 매출 959억에도 영업익 20%·순이익 92% 급감 '수익성 빨간불'… 자회사 줄줄이 적자·무리한 투자 후폭풍?

[The Numbers] 함샤우트글로벌, 매출 15% 감소·순이익 37% 급감 '어닝쇼크'… 9.8억 회계오류·특수관계자 대여금 4배 급증·부채비율 425% '리스크'

[The Numbers] 다이닝브랜즈그룹(BHC), 영업이익률 27%·당기순이익 40% 급증…1408억 배당잔치·7건(192억) 법적소송·종속사 손상차손 13억 '지배구조의 부끄러운 민낯'

[랭킹연구소] 500대 기업 대표이사 거주지 순위, 디에이치퍼스티어아이파크>나인원한남>래미안퍼스티지>한남더힐>동양파라곤>레이크팰리스>반포자이>브라이튼여의도>LG한강자이>올림파크포레온>판교푸르지오그랑블 順

[랭킹연구소] 2025년 1000大기업 영업이익 189조·순익 1위 27년 만에 교체…SK하이닉스>삼성전자>한국전력>기아>KB금융>현대차>기업은행>SK이노베이션>신한지주>삼성화재 順

[랭킹연구소] 옴디아 ‘삼성 1위' vs 카운터포인트 '애플 1위’…1분기 다른 스마트폰 세계지도, 진짜 1위는?

[빅테크칼럼] 유출된 오픈AI 주주명부 '발칵' MS 18배 수익과 올트먼의 지분…“지분 0% CEO가 이끄는 8520억달러 기업”

[빅테크칼럼] AI 거인 앤트로픽, 클로드 코드 51만 줄 소스 대유출… 연속 보안 실책에 업계 충격

[The Numbers] 5조 매출 배민(우아한형제들)의 그늘…수익성 역주행·5700억 본사 송금·공정위 칼날 '삼중고'

[강남비자] “강남아파트 연고전"… 반포 원베일리 vs 잠원 메이플자이, 입주민 스포츠 대결 추진 "반포 대장주, 나야나"

[The Numbers] 메가커피 운영 엠지씨글로벌, 매출 6469억이지만 '속빈 강정'…그 뒤엔 772억 '오너 배당잔치'·1057억 차입금 폭탄·해외법인 적자누적

[이슈&논란] NYT, 비트코인 창시자 사토시 나카모토로 아담 백 지목…증거는 쌓였지만 결론은 없다

[The Numbers] 피알원, 매출 6.2% 급감에 영업이익 45% 곤두박질…오너 일가 연계 특수관계자 거래 580억원 '내부거래 그물망' 촘촘

[The Numbers] 라이나생명, 영업이익 26% 급감에도 美 본사에 3000억 '배당 잔치'… 자본유출 논란 '도마 위'·법적소송 29건

[The Numbers] 테슬라코리아, 매출 3조원 돌파 2배급증에도 '한정의견' 낙인…배당성향 175%·세무추징 251억·이전가격 조정 645억의 민낯

[The Numbers] 야놀자 품 '놀유니버스', 매출 167% 급증에도 짙어진 '리스크'…부채비율 222%·유동성악화 등 재무 '빨간불'·3건 법적소송 53억

[The Numbers] 농심켈로그, 매출 정체·이익 급감에도 ‘순이익 90%’ 배당에 ‘기술료·수수료’까지 본사行…"한국 법인은 현금 인출기"

[The Numbers] 제주신화월드, 영업손실 지속·부채비율 악화 '흔들'…1.3조 결손금에 6건 소송·차입금 '부담'에 경영진 고액보상·본사로열티 '빈축'

[The Numbers] 케이피알(KPR), 매출 353억·영업이익률 0.9% '수익성 적신호'…쥐꼬리 이익·현금흐름 악화에 오너일가 '배당 논란'

[이슈&논란] ‘평균 7억→13억’ 하이닉스 성과급, K-칩스 세제와 사회공유 '논란'…"성과는 기업 몫, 리스크 헤지는 세제 몫, 불합리"

[The Numbers] 귀뚜라미홀딩스, 순이익 70% 증발·3628억 '폭탄배당'의 민낯…재무성적 빨간불·579억 특수관계자 거래·69억 소송·종속기업 다수 적자 '첩첩산중'

[The Numbers] 성원애드피아, 매출 1000억원대 방어·순이익 19% 급감…오너일가 배당 3배 ‘껑충’ 특수관계자 자금대여·소송 '리스크'

[빅테크칼럼] 엔비디아 독주에 칼 빼든 앤트로픽…‘3.5GW 동맹’ 넘어 자체 AI 칩까지 노린다

[The Numbers] 호반건설, 매출 35% 급감에 PF 부실·대손상각 2380억 '직격탄'…오너일가 245억 배당잔치·소송 99건 1600억·특수관계자 자금 '퍼주기'

[이슈&논란] 비트코인 개발자들, 양자 컴퓨터 위협에 사토시 시대 코인 동결 제안…소유권과 보안 사이 '줄타기'

[빅테크칼럼] “가짜 오픈AI 앱도 진짜처럼”…북한發 Axios 공급망 공격, macOS 인증서까지 영향 미쳐

[The Numbers] "커피향 대신 붉은 잉크" 탐앤탐스…자본 완전잠식·감사의견 거절·47건 소송·147억 단기차입금에 현금 고작 5억

[The Numbers] 배스킨라빈스·던킨도너츠(비알코리아), 영업적자 지속에 77억 로열티·7건 소송(82억) '삼중고'에도 오너 배당금 18% 올렸다

[The Numbers] '이차돌' 운영사 다름플러스, 감사인 의견거절·회생절차 속 '완전자본잠식'… 부채총계 192억에 현금은 1440만원·공정위 등 소송도 3건 '첩첩산중'

[The Numbers] 본아이에프, 매출 3000억 돌파·영업이익 20% 급감…오너 일가 '배당 잔치'·특수관계자 자금 지원에 '속빈 강정'

[이슈&논란] “배터리도 소비자 권리”…EU, 2027년까지 스마트폰에 사용자 교체가능 배터리 의무화

[The Numbers] 정용진·RM·홍라희 침대 '바이스프링(인퍼니스)', 매출 18% 급감에 영업이익 반토막…영업이익 62%, 대표에게 지급 '오너 사익'·주식단기 투기성 거래 '경고등'

[랭킹연구소] 한국 그룹 총수 주식재산 순위…이재용>서정진>정의선>정몽준>김범수>방시혁>최태원>조현준>이동채>이재현 順

[빅테크칼럼] “AI가 나를 지운다”는 공포, Z세대의 ‘조용한 사보타주’…Z세대 직원 44%, 회사 AI 도입 거부