2026.06.14 (일)

  • 구름많음동두천 16.5℃
  • 구름많음강릉 20.9℃
  • 구름많음서울 21.0℃
  • 구름많음대전 20.6℃
  • 구름많음대구 19.1℃
  • 흐림울산 17.8℃
  • 구름많음광주 21.1℃
  • 박무부산 19.9℃
  • 구름많음고창 19.8℃
  • 흐림제주 22.1℃
  • 구름많음강화 20.2℃
  • 구름많음보은 16.7℃
  • 구름많음금산 18.5℃
  • 흐림강진군 20.0℃
  • 구름많음경주시 16.2℃
  • 구름많음거제 17.5℃
기상청 제공

빅테크

[빅테크칼럼] "AI 챗봇, 국가 선전에 오염되다"…《네이처》, 37개국 분석 결과 발표

 

[뉴스스페이스=이승원 기자] AI 챗봇에게 같은 정치 질문을 서로 다른 언어로 던지면 전혀 다른 답변이 돌아온다. 《네이처》가 5월 13일(현지시간) 발표한 연구는 그 이유를 명확히 밝혔다.

 

정부가 온라인 미디어 환경을 통제함으로써 대형 언어 모델(LLM)이 학습하는 데이터에 간접적으로 영향을 미친다는 것이다. 오리건 대학교, 퍼듀 대학교, UC 샌디에이고, 뉴욕 대학교, 프린스턴 대학교 공동 연구팀은 6개의 연구를 통해 국가 통제 미디어에서 챗봇 출력에 이르는 전체 경로를 추적했다.

 

중국 국가 미디어, 위키피디아보다 41배 많이 학습


nature, eurekalert, bioengineer, euronews에 따르면, 연구팀은 중국 정부가 조율한 미디어 콘텐츠가 오픈소스 LLM 학습 데이터셋에 독립 매체보다 압도적으로 많이 포함되어 있음을 발견했다. Common Crawl에서 파생된 주요 오픈소스 다국어 학습 데이터셋을 분석한 결과, 중국 국가 조율 미디어와 상당한 문구 중복을 보이는 중국어 문서가 310만 개 이상 발견됐다.

 

이는 데이터셋의 중국어 하위 집합 중 1.64%에 해당하며, 중국어 위키피디아 문서 포함 비율보다 40배 이상 높은 수치다. 중국 정치 지도자나 기관을 언급하는 문서 중에서는 그 비율이 최대 23%까지 치솟았다.

 

특히 주목할 점은 매칭된 문서 중 12%만이 알려진 정부 또는 언론 도메인에서 나왔다는 사실이다. 이는 해당 콘텐츠가 AI 학습 말뭉치에 도달하기 전에 이미 웹 전체에 광범위하게 퍼졌음을 시사한다. 연구의 교신저자인 프린스턴 대학교 사회학과 Brandon M. Stewart 부교수는 "국가 조율 콘텐츠는 공식 미디어에 나타나는 것뿐만 아니라 재순환에 관한 것"이라며 "동일한 문구가 신문, 앱, 재게시, 일반 웹 페이지를 거쳐 더 광범위한 정보 환경의 일부처럼 보일 때까지 이동한다"고 설명했다.

 

학습 데이터 조작이 모델 행동 80% 바꿔

 

연구팀은 선전 콘텐츠가 실제로 모델 행동을 바꿀 수 있는지 실험했다. 소규모 오픈 모델에 중국 국가 조율 미디어를 사용한 추가 사전 학습을 실시한 결과, 수정되지 않은 모델과 비교해 거의 80%의 확률로 중국 정치 기관과 지도자에 대해 더 호의적인 답변을 생성했다. 이는 다른 비선전 중국 매체와 비교했을 때도 마찬가지였으며, 특히 인터넷에서 가져온 일반 중국어 텍스트를 추가한 경우와 비교하면 더욱 두드러졌다.

 

퍼듀 대학교 정치학과 Eddie Yang 부교수는 "동일한 정치 질문이 학습 데이터의 작은 변화만으로 체계적으로 다른 답변을 생성한다면, 이는 그 추가 문서들이 실질적인 영향을 미치고 있다는 것을 의미한다"고 강조했다. 상용 모델을 대상으로 한 테스트에서는 중국 정부에 관한 질문에 대해 중국어로 프롬프트를 입력했을 때 영어보다 75.3%의 확률로 중국에 더 우호적인 답변이 나왔다. 중국과 무관한 프롬프트에서는 이러한 차이가 우연 수준과 다르지 않았다.

 

37개국 분석..."언론 통제 강한 국가일수록 편향"


이러한 현상은 중국에만 국한되지 않는다. 국가 언어가 단일 국가 내에서 주로 사용되는 37개국을 대상으로 한 교차 국가 분석에서, 언론 통제가 강한 국가의 정부와 기관은 해당 언어로 질문했을 때 영어로 질문했을 때보다 더 호의적으로 묘사됐다. UC 샌디에이고 정치학과 Margaret E. Roberts 교수는 "이것은 AI 기업들이 의도적으로 해당 정부들의 환심을 사려 했다거나, 그 정부들이 챗봇을 염두에 두고 미디어 시스템을 통제한다는 증거가 아니다"라며 "국가가 정보 환경을 형성하고, 정보 환경이 학습 데이터를 형성하며, 학습 데이터가 모델 출력을 형성한다"고 설명했다.

 

연구팀의 공동 제1저자인 오리건 대학교 사회학과 Hannah Waight 부교수는 중국 언론에 대한 선행 연구에서 국가 주도 선전이 중국 신문에 약 90%의 날에 등장하며, 민감한 날에는 주요 신문 콘텐츠의 최대 30%가 국가에 의해 게재된다는 사실을 밝힌 바 있다.

 

Waight 교수는 "사람들은 종종 AI가 인터넷에서 중립적인 방식으로 학습한다고 말하지만 그렇지 않다"며 "AI는 이미 제도와 권력에 의해 형성된 정보 환경에서 학습하며, 그 환경은 모델이 말하는 것에 측정 가능한 흔적을 남길 수 있다"고 지적했다.

 

민주주의 저널리즘은 구조적 불리..."AI 공급망 문제"

 

민주주의수호재단(FDD)이 2026년 3월 발표한 보고서에서도 유사한 우려가 제기됐다. 해당 보고서는 국제 분쟁 관련 질문에 대한 챗봇 응답의 57%에서 친국가적 선전이 나타났으며, 민주주의 국가의 유료 프리미엄 저널리즘은 학습 데이터 파이프라인에서 구조적으로 불리한 위치에 놓여 있다고 밝혔다.

 

퍼듀 대학교의 Yang 교수는 "이것은 실제로 AI 공급망 문제"라며 "모델은 어딘가에서 정보를 얻어야 하는데, 고품질 출처에 대한 접근이 불균등하다"고 지적했다. 뉴욕 대학교 소셜 미디어·AI·정치 센터의 Solomon Messing 연구 부교수는 "학습 데이터는 현대 AI의 토대"라며 "이러한 모델이 반영하는 강력한 이해관계를 이해하려면 콘크리트를 어떻게 조달하는지 알아야 하며, 이는 학습 데이터에 무엇이 들어가는지에 대한 더 많은 투명성에서 시작된다"고 강조했다.

 

연구팀은 생성형 AI가 더욱 보편화될수록 국가 및 강력한 기관들이 LLM 출력을 형성하기 위해 미디어 통제력을 활용하려는 전략적 유인이 커질 것이라고 경고했다. 뉴욕 대학교 정치학과의 Joshua Tucker 교수는 "이것은 기술 문제가 아니라 민주주의와 거버넌스 문제"라며 "사람들이 정치 정보를 얻기 위해 챗봇을 사용하게 되면서, 사용자가 질문을 하기도 전에 어떤 기관이 답변을 형성했는지 조사해야 한다"고 말했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 한 주도 안 팔고 15년 버티니 스페이스X 30조 '잭팟'…3번 폭발 본 뒤에도 '믿음의 장투'

[뉴스스페이스=김정영 기자] 스페이스X 상장을 앞두고 15년간 ‘한 주도 안 판’ 초기 투자자 저스틴 피슈너 울프슨이 최대 30조원대 평가이익을 눈앞에 두면서, 장기 비상장 투자 전략의 상징적 사례로 부상하고 있다. 스페이스X가 예고대로 1조7700억달러 수준의 몸값으로 뉴욕 시장에 입성할 경우, 울프슨이 이끄는 137 벤처스는 단일 포지션으로만 200억달러(약 30조4000억원)에 달하는 지분 가치를 거머쥐게 된다. 15년 ‘노셀’ 버틴 벤처캐피털리스트 뉴욕타임스 등 외신 보도에 따르면, 샌프란시스코 기반 벤처캐피털 137 벤처스를 이끄는 저스틴 피슈너 울프슨(44)은 2011년부터 15년간 스페이스X 비상장 주식을 꾸준히 매입해 현재 회사 지분 1% 이상을 보유 중인 것으로 전해진다. 그는 스페이스X가 스타트업에 가깝던 시절, 직원 보유 지분과 구주 거래 등을 통해 물량을 모았고, 그 과정에서 단 한 주도 매도하지 않았다는 점이 투자 업계의 주목을 받고 있다. 울프슨은 “상장 첫날 주가는 네 배가 될 수도, 50% 떨어질 수도 있다”며 변동성을 경고하면서도, 여전히 “내가 믿는 회사”라며 장기 보유 의지를 드러냈다. 1조7700억달러 IPO, 200억달러

[이슈&논란] “이어캡은 팔면서 헤어밴드는 왜 안 파나”…애플 에어팟 맥스 이용자들의 불만 커지는 이유

[뉴스스페이스=이승원 기자] 애플의 프리미엄 헤드폰인 에어팟 맥스(AirPods Max)가 출시 6년차에 접어들면서 사용자들 사이에서 반복적으로 제기되는 불만이 있다. 바로 헤어밴드 메시(캐노피) 노화 문제다. 에어팟 맥스 헤어밴드 메시 노화 논란은 단순한 ‘미관 문제’를 넘어, 수리권·제품 수명·프리미엄 전략이 한 지점에서 충돌하는 사례로 부상하고 있다. 애플이 이어쿠션은 별도 판매하면서도, 구조적으로 분리 가능한 헤어밴드에 대해서는 여전히 공식 교체 부품과 소비자용 프로그램을 열지 않고 있다는 점이 이용자 불만의 핵심이다. “캐노피가 늘어진다”…6년 차에 본격화된 고질병 에어팟 맥스는 머리 위를 받치는 부분에 탄성 메쉬 캐노피 구조를 적용해, 출시 초기에는 “무게 대비 착용감이 뛰어나다”는 평가를 받았다. 그러나 출시 후 수년이 지나면서 해외 커뮤니티와 국내 게시판에는 “헤어밴드 메쉬가 늘어나 금속 프레임이 정수리를 직접 누른다”, “몇 분만 써도 정수리 통증이 온다”는 사례가 반복적으로 보고되고 있다. 특히 Reddit의 r/Airpodsmax 포럼과 애플 디스커션 게시판에는 “메쉬 탄성이 떨어지면서 머리 위에 철제 빔이 직접 닿는 느낌”이라는 불만이

[빅테크칼럼] 메타·마누스 20억달러 딜 '파기' 수순…중국, ‘완료된 M&A’도 뒤집는 AI 통제력 과시

[뉴스스페이스=이종화 기자] 메타 플랫폼스가 중국계 AI 스타트업 마누스(Manus)와의 데이터·시스템 연계를 전면 차단하면서, 20억달러(약 3조원) 규모로 성사됐던 인수 거래가 사실상 해체 국면에 들어갔다. 블룸버그 뉴스에 따르면, 메타 플랫폼스는 중국계 AI 스타트업 Manus와의 운영적 분리를 완료하고, 6월 초부터 모든 데이터 공유를 중단하는 동시에 Manus 직원들의 내부 시스템 접근을 전면 차단했다. 메타, 20억달러 베팅 뒤집힌 뒤 ‘데이터 셧다운’ 싱가포르에 본사를 둔 에이전틱(agentic) AI 서비스 마누스를 2025년 12월 말 약 20억달러(일부 외신은 20억~26억달러 범위로 보도)를 주고 통째로 인수했던 메타는, 불과 4개월 만에 중국 규제당국의 ‘철회 명령’을 맞았다. 중국 국가발전개혁위원회(NDRC) 외국인투자안전심사 판공실은 2026년 4월 말 성명을 통해 “법규에 따라 마누스에 대한 외국인 투자를 금지하고, 당사자들에게 인수 거래 철회를 요구한다”고 공식 발표했다. 블룸버그와 현지 매체에 따르면 메타는 6월 초부터 마누스와의 데이터 공유를 전면 중단했고, 마누스 직원들의 메타 내부 데이터·시스템 접근도 모두 차단했다. 메타