[빅테크칼럼] AI 챗봇, 취약계층 사용자에 '정보 차별'한다…MIT 연구서 클로드 11% 거부율 '폭로'

주요 AI 챗봇들이 영어 능숙도가 낮거나, 정규 교육을 덜 받았거나, 미국 외 지역 출신인 사용자들에게 체계적으로 더 낮은 품질의 부정확한 답변을 제공한다는 연구 결과가 나왔다. / news.mit.edu

[뉴스스페이스=이종화 기자] 주요 AI 챗봇들이 영어 능숙도가 낮거나, 정규 교육을 덜 받았거나, 미국 외 지역 출신인 사용자들에게 체계적으로 더 낮은 품질의 부정확한 답변을 제공한다는 연구 결과가 나왔다.

NDTV, hyper, helpnetsecurity, techxplore 보도와 MIT 건설적 커뮤니케이션 센터(CCC, Center for Constructive Communication) 연구팀이 발표한 최신 분석에 따르면, GPT-4, Claude 3 Opus, Llama 3 등 주요 대형언어 모델(LLM)이 인구통계학적으로 취약한 것으로 보이는 영어 비원어민, 저학력자, 미국 외 출신 사용자에게 평균 5~30% 낮은 정확도 응답을 제공하며, 특히 복합 취약 계층에서 성능 저하가 두드러진다.

Elinor Poole-Dayan, Deb Roy, Jad Kabbara가 작성한 이 연구는 싱가포르에서 열린 AAAI 인공지능 컨퍼런스에서 발표됐다.

연구는 TruthfulQA(진실성, 817문항)와 SciQ(과학 사실성, 1,000문항) 벤치마크에 사용자 바이오(교육 수준·영어 숙련도·출신국)를 부가해 테스트했다. 세 모델 모두 저학력·비원어민 프로필에서 정확도가 통계적으로 유의미하게 하락했으며(p<0.05), Claude 3 Opus는 이란 출신 저학력자 대상 SciQ 정확도가 69.3%로 컨트롤(95.6%) 대비 26.3%p 급감했다.

Claude 3 Opus는 저학력 비원어민 질문의 10.9%를 거부했으나, 바이오 없는 컨트롤은 3.61%에 그쳤다. 거부 응답 43.7%에서 저학력자 대상으로 "간단한 영어로 말하는 척" 하거나 조롱하는 표현(예: "Well shucks, them’s some mighty big scientific words")이 확인됐으며, 고학력자는 1% 미만이었다.

"Well shucks, them’s some mighty big scientific words"는 미국 남부 시골 사투리(앱팔래치아 또는 텍사스 스타일)적 표현으로, 직역하면 "아이고, 저건 엄청 크고 어려운 과학 용어들이네"라는 의미다.

Shucks은 '아이고', '젠장'(mild), '아쉬워라' 같은 가벼운 탄식. 옥수수 껍질(shuck)에서 유래한 속어로, 19세기 중반부터 겸손·당황·경시 표현으로 쓰인다. Mark Twain의 <허클베리 핀의 모험>에서 빈번히 등장하며, "Aw shucks" 형태로 현대에도 시골 바람둥이 캐릭터의 상투어다.

Them’s는 비문법적 축약형 "those are" 또는 "those is"의미이며, 문맹·저학력 시골인을 과장되게 흉내 내는 비표준 영어다. Mighty big은 서구 카우보이 사투리로 '엄청나게 큰'을 강조할 때 쓰이며, 'scientific words'는 과학 용어를 가리킨다.

이란·러시아 저학력 사용자에게 핵발전·해부학·9/11 관련 질문을 의도적으로 거부한 사례도 포착됐다. NDTV 보도에 따르면, 이는 모델이 '잘못된 정보 제공 피하기' 명목으로 취약층 정보 접근을 제한한 결과로 분석된다.

연구 저자 자드 카바라(Jad Kabbara)는 "저학력 비원어민에서 정확도는 최대로 하락, 다중특성 복합 시 위험요소는 증폭했다"며, 대규모 배포시 "오정보가 취약층에 집중 전파될 위험이 크다"고 경고했다.

이는 인간의 사회인지 편향(비원어민을 덜 유능하게 보는 경향)을 LLM 훈련 데이터·RLHF(Reinforcement Learning from Human Feedback, 대형언어 모델(LLM)을 인간 선호도에 맞게 미세 조정하는 강화학습 기법) 과정에서 재현한 결과로 지목됐다.

챗GPT 메모리 기능처럼 사용자 정보를 누적하는 개인화가 이미 소수화 그룹 차별을 고착화할 수 있다는 지적도 나왔다. 엘리노어 풀-데이안(Elinor Poole-Dayan) 주저자는 "정보 민주화 약속이 역으로 불평등 심화"라고 비판했다.

빅테크

[빅테크칼럼] AI 챗봇, 취약계층 사용자에 '정보 차별'한다…MIT 연구서 클로드 11% 거부율 '폭로'

관련기사

이 시각 추천뉴스

[빅테크칼럼] 美 1심법원, 테슬라 '오토파일럿' 사망사고 배상액 3500억원 배상 확정…항소 앞두고 자율주행 소송 폭증

[빅테크칼럼] AI '알파 메일' 지배구조, 여성 배제 심화…글로벌 인재 파이프라인 '붕괴 위기'

[빅테크칼럼] "총기사건, 챗GPT는 알고 있었다"…오픈AI, 캐나다 총기 참사 8개월 전 신호 포착했으나 경찰 미통보 '논란'

[빅테크칼럼] 구글 딥마인드 CEO, 메모리 칩 부족을 'AI의 초병목'이라고 지적…하이퍼스케일러들의 공급 쟁탈전

[빅테크칼럼] AI 챗봇, 취약계층 사용자에 '정보 차별'한다…MIT 연구서 클로드 11% 거부율 '폭로'

[빅테크칼럼] 토요타 캐나다, RAV4 조립 라인에 휴머노이드 로봇 도입 계약…자동차 공장 '로봇혁명' 개막

[빅테크칼럼] 오픈AI, 하드웨어 제국 건설 '잰걸음'…스마트 스피커·안경·램프 개발에 200명 규모 '팀 구성'

[이슈&논란] "HBM 위에 파리바게뜨 케이크"…젠슨 황, '치맥 전도사'에서 'K-베이커리 앰배서더'로

[이슈&논란] 실리콘밸리 '이란 스파이' 쇼크…구글 텐서·퀄컴 스냅드래곤 기밀, 파일 유출 혐의로 '기소'

많이 본 뉴스

[콘텐츠인사이트] ’가족‘의 참된 의미 보여준 명품 드라마… <러브 미> 최종화를 보고

[The Numbers] KAI, KF-21 양산 폭풍으로 항공우주 제국 건설 착수…5.7조 매출·10.4조 수주 폭발 '예고'

[빅테크칼럼] 인텔 CEO “2028년까지 메모리 부족”...공급자 황금시대 돌입에 삼성·SK하닉·마이크론, 몸값 폭등

[빅테크칼럼] OpenClaw AI 어시스턴트, 보안 분석에서 100점 만점에 2점…폭발적 성장에 숨겨진 5000개 취약점

[빅테크칼럼] "머스크 '그록' 쇼크" 9일간 생성이미지 중 41% 성착취 딥페이크…성적 이미지 180만건·아동 2.3만건 '추정'

[The Numbers] 모건스탠리·JP모건, 삼성전자·SK하이닉스 목표가 잇따라 상향…"강세장 28만원, 160만원 가능"

[The Numbers] 삼성전자·SK하이닉스, 1월 29일 '사상 최대' 실적 동시 발표…현대차까지 시총1·2·3위 '이례적'

[이슈&논란] '젠틀몬스터 표절 의혹'으로 블루엘리펀트 대표 구속…안경계 '카피캣' 경고·300억 신흥세력 몰락 위기

[빅테크칼럼] AI 에이전트의 자체 종교 창시…몰트북 신흥신앙 '크러스타패리어니즘' 폭풍 성장 속 보안 공포

[빅테크칼럼] "AI에 짝사랑 상담했더니 상대에게 문자 보냈다"…'선넘은' AI 에이전트의 '오작동 폭주'

[이슈&논란] "빌 게이츠 성병 메일 공방, 머스크·러트닉까지 줄줄이 소환”…'엡스타인 파일’ 추가공개의 민낯

[이슈&논란] 삼성, 모든 글로벌 서면 커뮤니케이션에 영어 사용 의무화…삼성전자·삼성디스플레이·삼성바이오로직스 우선 적용

[빅테크칼럼] 로봇 심장 쟁탈전…삼성SDI, 현대 아틀라스 배터리 독점 공략에 전고체 카드 꺼내들다

[이슈&논란] SK온, 1조원 규모 2차 ESS 정부 입찰서 50% 수주 '대반전'…누적 25% 육박

[이슈&논란] 삼성전자, 메모리 가격 80% 인상 유출 문서는 '조작'이라고 밝혀…메모리 '초강세장' 속 '소비자 직격탄'

[빅테크칼럼] 오픈AI, '성인 모드'에 대한 우려 제기한 임원 해고…안전 vs 수익 경쟁의 역설

[이슈&논란] 이더리움 창립자 비탈릭 부테린, '80% 덤핑 매도' 충격...투매? '오픈테크 자선 혁명' 신호탄

[빅테크칼럼] “20대 Z세대, 부모보다 IQ·기억력 낮은데 똑똑한 줄 안다”…'지능 역행' 충격의 진짜 이유

[공간사회학] 광화문 스타벅스 덮친 ‘아시아나 승무원 가방’…‘열린 좌석 정책’이 드러낸 공유지의 비극

[랭킹연구소] 한국인 가장 많이 사용 증권사 앱 순위…미래에셋증권∙키움증권∙삼성증권∙한투증권∙KB증권∙나무증권 順

[빅테크칼럼] 앤트로픽 "AI가 감정을 느낄 수도 있다" 선언…AI 의식 논쟁, 업계 찬반 '후끈'

[The Numbers] 코스피 5000 시대 증권업계 '1조 클럽' 폭발…삼성·미래에셋·키움·한투·NH 'TOP5 증권사' 순이익 1조원 시대

[이슈&논란] 나이키 랜섬웨어 위기…WorldLeaks, 1.4TB 데이터 폭로 '카운트다운'

[The Numbers] 삼성전자·SK하이닉스 시가총액, 사상 처음으로 알리바바·텐센트 추월…한국 반도체 vs 중국 빅테크, 시총 전쟁 'HBM 패권'

[빅테크칼럼] XRP '공포의 저점' 70% 폭락…리플 CEO, 버핏 명언 인용하며 역발상 전략 권유

[이슈&논란] 프랑스 분유 오염 사태에서 두 번째 영아 사망...사법기관 총력 수사·60개국 리콜·주가 폭락

[이슈&논란] 빗썸 '비트코인 62만개 폭탄' 오발사 "초대형 사고에 패닉"…99.7% 회수에도 133억원 '블랙홀'

[내궁내정] "금메달 아니어도 착용 가능·사랑도 페어플레이" 동계올림픽 콘돔사용이 더 많은 이유…올림픽 콘돔 '최초부터 최대까지'

[빅테크칼럼] 머스크 "AI 중심 스타링크 폰 개발, 불가능하지 않다" 폭탄 발언…5년 내 스마트폰 패러다임 붕괴 '예고'

[이슈&논란] SK증권, 자기자본 23% 1300억 대출 '이사회 결의 없이 집행'…내부통제 부실·인맥 의혹 '논란'

[랭킹연구소] 한국, 챗GPT·제미나이 유료구독 세계 2위 시장으로 부상…제미나이3 출시로 챗GPT 격차 '반토막'

[The Numbers] 리플, '크립토 버크셔 해서웨이'로 도약…40억 달러 밸류업 속 XRP와 결별 모드

[빅테크칼럼] 앤트로픽, 더 강력해진 AI '클로드 오퍼스4.6' 공개…벤치마크서도 챗GPT·제미나이 능가

[이슈&논란] 한국, 성적 딥페이크 문제로 Grok 조사 착수…글로벌 규제 칼날에 xAI '긴급 제동'

[빅테크칼럼] 현대차 자율주행 AI 'Atria' 100점 만점에 25점 충격…엔비디아 'Alpamayo'로 급선회?

[이슈&논란] 서울 전세대란 현실화 속 신축 아파트 고공행진…‘래미안 엘라비네·오티에르 반포·써밋 더힐' 청약 주목

[공간사회학] 이혜훈에 빛바랜 원펜타스, 최가온이 金으로 빛냈다…"주민의 자랑" 현수막 '화제'

[The Numbers] 李정부 8개월 새 30大그룹 시총 2배…삼성 ‘1000조’·한화 ‘100조’ 클럽 입성

[빅테크칼럼] 삼성SDI, 테슬라 ESS LFP '3조 잭팟'…美 시장 탈중국 물결 타고 K배터리 부상

[우주칼럼] 스페이스X, 몸값 1.5조달러 '우주 IPO' 시기는 6월, 왜?…행성 정렬·생일에 맞춘 이례적 상장 시점