2026.04.09 (목)

  • 흐림동두천 10.0℃
  • 흐림강릉 11.3℃
  • 서울 10.8℃
  • 대전 11.8℃
  • 대구 15.3℃
  • 울산 12.6℃
  • 광주 15.9℃
  • 부산 13.0℃
  • 흐림고창 16.1℃
  • 흐림제주 19.1℃
  • 흐림강화 10.4℃
  • 흐림보은 13.1℃
  • 흐림금산 12.3℃
  • 흐림강진군 17.1℃
  • 흐림경주시 13.7℃
  • 흐림거제 15.2℃
기상청 제공

빅테크

[빅테크칼럼] AI 챗봇, 취약계층 사용자에 '정보 차별'한다…MIT 연구서 클로드 11% 거부율 '폭로'

 

[뉴스스페이스=이종화 기자] 주요 AI 챗봇들이 영어 능숙도가 낮거나, 정규 교육을 덜 받았거나, 미국 외 지역 출신인 사용자들에게 체계적으로 더 낮은 품질의 부정확한 답변을 제공한다는 연구 결과가 나왔다.

 

NDTV, hyper, helpnetsecurity, techxplore 보도와 MIT 건설적 커뮤니케이션 센터(CCC, Center for Constructive Communication) 연구팀이 발표한 최신 분석에 따르면, GPT-4, Claude 3 Opus, Llama 3 등 주요 대형언어 모델(LLM)이 인구통계학적으로 취약한 것으로 보이는 영어 비원어민, 저학력자, 미국 외 출신 사용자에게 평균 5~30% 낮은 정확도 응답을 제공하며, 특히 복합 취약 계층에서 성능 저하가 두드러진다.


Elinor Poole-Dayan, Deb Roy, Jad Kabbara가 작성한 이 연구는 싱가포르에서 열린 AAAI 인공지능 컨퍼런스에서 발표됐다.

 

연구는 TruthfulQA(진실성, 817문항)와 SciQ(과학 사실성, 1,000문항) 벤치마크에 사용자 바이오(교육 수준·영어 숙련도·출신국)를 부가해 테스트했다. 세 모델 모두 저학력·비원어민 프로필에서 정확도가 통계적으로 유의미하게 하락했으며(p<0.05), Claude 3 Opus는 이란 출신 저학력자 대상 SciQ 정확도가 69.3%로 컨트롤(95.6%) 대비 26.3%p 급감했다.

 

Claude 3 Opus는 저학력 비원어민 질문의 10.9%를 거부했으나, 바이오 없는 컨트롤은 3.61%에 그쳤다. 거부 응답 43.7%에서 저학력자 대상으로 "간단한 영어로 말하는 척" 하거나 조롱하는 표현(예: "Well shucks, them’s some mighty big scientific words")이 확인됐으며, 고학력자는 1% 미만이었다.

 

"Well shucks, them’s some mighty big scientific words"는 미국 남부 시골 사투리(앱팔래치아 또는 텍사스 스타일)적 표현으로, 직역하면 "아이고, 저건 엄청 크고 어려운 과학 용어들이네"라는 의미다. 

 

Shucks은 '아이고', '젠장'(mild), '아쉬워라' 같은 가벼운 탄식. 옥수수 껍질(shuck)에서 유래한 속어로, 19세기 중반부터 겸손·당황·경시 표현으로 쓰인다. Mark Twain의 <허클베리 핀의 모험>에서 빈번히 등장하며, "Aw shucks" 형태로 현대에도 시골 바람둥이 캐릭터의 상투어다. 

 

Them’s는 비문법적 축약형 "those are" 또는 "those is"의미이며, 문맹·저학력 시골인을 과장되게 흉내 내는 비표준 영어다. Mighty big은 서구 카우보이 사투리로 '엄청나게 큰'을 강조할 때 쓰이며, 'scientific words'는 과학 용어를 가리킨다.

 

이란·러시아 저학력 사용자에게 핵발전·해부학·9/11 관련 질문을 의도적으로 거부한 사례도 포착됐다. NDTV 보도에 따르면, 이는 모델이 '잘못된 정보 제공 피하기' 명목으로 취약층 정보 접근을 제한한 결과로 분석된다.

 

연구 저자 자드 카바라(Jad Kabbara)는 "저학력 비원어민에서 정확도는 최대로 하락, 다중특성 복합 시 위험요소는 증폭했다"며, 대규모 배포시 "오정보가 취약층에 집중 전파될 위험이 크다"고 경고했다.

 

이는 인간의 사회인지 편향(비원어민을 덜 유능하게 보는 경향)을 LLM 훈련 데이터·RLHF(Reinforcement Learning from Human Feedback, 대형언어 모델(LLM)을 인간 선호도에 맞게 미세 조정하는 강화학습 기법) 과정에서 재현한 결과로 지목됐다.

 

챗GPT 메모리 기능처럼 사용자 정보를 누적하는 개인화가 이미 소수화 그룹 차별을 고착화할 수 있다는 지적도 나왔다. 엘리노어 풀-데이안(Elinor Poole-Dayan) 주저자는 "정보 민주화 약속이 역으로 불평등 심화"라고 비판했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 구글 CEO "AI가 거의 모든 SW 무너뜨릴 것"... 순다르 피차이의 경고가 가리키는 사이버 보안의 ‘급변점’

[뉴스스페이스=이현주 기자] 구글 CEO 순다르 피차이가 “AI 모델이 세상에 존재하는 사실상 모든 소프트웨어를 무너뜨리게 될 것”이라고 공개 경고하면서, AI 확산의 숨은 뇌관으로 사이버 보안 리스크가 다시 전면에 부상하고 있다. nytimes, Techmeme, searchenginejournal, securityaffairs에 따르면, 그는 최근 스트라이프 공동창업자 존 콜리슨과 투자자 엘라드 길이 진행하는 팟캐스트 ‘Cheeky Pint’에 출연해, 메모리·전력·웨이퍼 등 하드웨어 공급 병목과 더불어 보안 취약성이 AI 산업의 성장 속도를 제약할 수 있는 핵심 변수라고 지목했다. 특히 AI가 제로데이(0day) 취약점의 ‘발견 비용’을 극단적으로 낮추면서, 소프트웨어 생태계 전반에 걸친 구조적 충격이 도래할 수 있다는 점을 수치로 뒷받침한 셈이다. “이미 무너지고 있을지도 모른다”는 피차이의 문제의식 피차이는 해당 팟캐스트에서 “이 모델들은 분명히 세상에 존재하는 사실상 모든 소프트웨어를 무너뜨리게 될 것이다. 어쩌면 이미 그렇게 되고 있는지도 모른다, 아직 모를 뿐”이라고 말했다. 진행자가 SSH 같은 기초 프로토콜까지 위험해지는 것이냐고 되묻자 그

[빅테크칼럼] “매출은 폭발, 이익은 실종”…IPO 앞둔 오픈AI·앤트로픽, ‘슈퍼 컴퓨트 베팅’의 명암

[뉴스스페이스=이종화 기자] IPO를 앞둔 오픈AI와 앤트로픽 재무 자료 분석결과 두 회사 모두 수익성 없는 것으로 나타났다. 실리콘밸리에서 가장 가치 있는 두 인공지능 스타트업이 역사상 최대 규모의 기업공개를 향해 경쟁하고 있지만, 기밀 재무 문서에 따르면 오픈AI와 앤트로픽 모두 수익을 내는 단계와는 거리가 먼 것으로 밝혀졌다. 월스트리트저널 보도는 두 회사의 재무 상황에 대한 내부 분석을 제공하며, 공통된 취약점을 부각시켰다. AI 모델 구축 및 운영에 드는 비용이 급증하면서 빠르게 성장하는 매출을 계속 앞지르고 있다는 분석이다. 폭발하는 매출, 더 빠르게 치솟는 비용 월스트리트저널(WSJ)이 입수한 투자자용 기밀 재무자료에 따르면, 오픈AI는 2030년이 돼서야 손익분기점에 도달할 것으로 예상하고 있으며, 앤트로픽은 2028년 흑자 전환을 목표로 하고 있다. 두 회사 모두 AI 붐의 중심에 서 있지만 ‘언제 돈을 버느냐’라는 질문에 대한 답은 상당히 다르다. 두 회사 간의 격차는 AI 붐을 헤쳐나가는 극명하게 다른 전략을 반영하며, 두 회사 모두 2026년 4분기 IPO 가능성을 준비하고 있다. 오픈AI는 이미 매출 규모에서 시장을 선도하고 있다. 2