2026.06.14 (일)

  • 흐림동두천 19.7℃
  • 맑음강릉 24.7℃
  • 흐림서울 26.4℃
  • 흐림대전 19.2℃
  • 맑음대구 29.7℃
  • 맑음울산 25.2℃
  • 구름많음광주 26.8℃
  • 맑음부산 25.1℃
  • 흐림고창 24.8℃
  • 맑음제주 27.3℃
  • 맑음강화 24.8℃
  • 구름많음보은 26.4℃
  • 흐림금산 22.9℃
  • 맑음강진군 27.5℃
  • 맑음경주시 27.4℃
  • 맑음거제 26.7℃
기상청 제공

빅테크

[빅테크칼럼] ‘Google’도 제대로 못 쓰는 구글 AI…시간당 5700만건 틀리는 검색 혁신의 그림자

 

[뉴스스페이스=이종화 기자] 구글이 검색 전면에 내세운 ‘AI 개요(AI Overview)’가 이번에는 자사 서비스 이름조차 제대로 못 쓰는 기초적인 철자 오류로 다시 한번 신뢰성 논란의 중심에 섰다.

 

구글 AI, ‘Google’ 철자도 헷갈렸다


최근 소셜미디어와 techcrunch, mashable, businessinsider, indiatoday 보도에 따르면, 구글 AI 개요가 “Google이라는 단어에 P가 몇 개 있느냐”는 질문에 “두 개”라고 답하거나, “poop에는 r이 정확히 한 개 있다”고 말하는 사례가 잇따라 공유됐다. 또 “journalism”의 d 개수를 묻자 “두 개”라고 답하면서 철자를 “j-o-u-r-n-a-d-i-s-m”으로 잘못 나열했고, 미국 대통령 도널드 트럼프(Trump)의 성에 P가 하나 있다는 사실은 맞히면서도 철자를 “t-r-p-u-m”으로 뒤섞어 표기한 경우도 포착됐다.

 

구글은 테크크런치(TechCrunch)에 보낸 이메일에서 “단어 내 글자 수 세기는 LLM에 오래전부터 알려진 과제이며, 해당 문제를 수정하기 위해 작업 중”이라고 공식 입장을 밝혔다.

 

아키텍처에 각인된 ‘문자 단위 무능’

 

전문가들은 이번 사태를 단순한 버그가 아니라 대규모 언어모델(LLM)의 구조적 한계를 드러낸 사건으로 진단한다. 인간이 단어를 문자(char)의 연속으로 읽는 것과 달리, LLM은 텍스트를 단어 전체나 일부, 음절 등을 묶은 ‘토큰(token)’ 단위로 쪼개 숫자 벡터로 변환해 처리한다.

 

앨버타대학교 매튜 구즈디얼(Matthew Guzdial) 교수는 “트랜스포머 아키텍처 기반 LLM은 실제로 텍스트를 글자 단위로 읽지 않는다”며 “‘the’를 하나의 의미 벡터로 인코딩할 뿐 T, H, E라는 개별 문자에 대한 지식은 없다”고 설명했다. 노스이스턴대학교의 셰리던 포이흐트(Sheridan Feucht)는 “토큰화 과정의 모호성 때문에 ‘완벽한 토크나이저’는 존재하지 않을 수 있다”며, 문자 세기·철자 검증 같은 작업은 구조적으로 취약할 수밖에 없다는 비관적 전망을 내놨다.

 

‘돌 먹고, 피자에 풀 바르라’던 AI 개요의 전력

 

이번 철자 해프닝은 AI 개요가 공개된 2024년 이후 반복돼 온 일련의 사고에서 보면 하나의 에피소드에 불과하다. 출시 직후 이 기능은 풍자 게시물을 곧이곧대로 인용해 “돌을 먹어도 된다”, “피자에 접착제를 바르라”고 조언하는 등 황당한 답변으로 전 세계적인 조롱을 받았다.

 

국내에서도 “미국에 얼마나 많은 무슬림 대통령이 있었는가”라는 질문에 “버락 오바마는 미국 최초의 무슬림 대통령”이라고 오답을 내놓은 사례가 보도되며 구글의 검증 체계가 도마에 올랐다. 불과 지난주에는 “disregard”를 검색했을 때 사전 정의 대신 “알겠습니다. 새로운 프롬프트나 질문이 생기면 언제든지 알려주세요!”라는 내부 시스템 프롬프트 문구가 그대로 노출되는 사고까지 발생해, 검색 결과와 시스템 메시지 경계 관리에도 허점이 드러난 바 있다.

 

‘정확도 91%’ 이면의 시간당 5,700만건 오답

 

구글은 AI 개요의 전반적인 성능이 이미 충분히 실용적 수준이라고 주장해 왔다. 뉴욕타임스가 AI 스타트업 오우미(Oumi)와 공동으로 실시한 테스트에 따르면 구글 검색의 AI 개요 정확도는 약 91%로 나타났다. 문제는 모수다. 구글은 연간 약 5조건의 검색 쿼리를 처리하는데, 9%의 오류율을 그대로 적용하면 AI 개요가 시간당 5,700만건 이상의 부정확한 답변을 생성하는 셈이다.

 

이는 분당 거의 100만건에 달하는 규모로, “대부분은 맞는다”는 통계 뒤에 막대한 절대량의 오답이 숨겨져 있다는 점을 여실히 보여준다. 더 심각한 것은 ‘겉으로는 맞는 것처럼 보이는 답변’의 품질이다. 같은 조사에서 AI가 정답을 제시한 경우에도 인용 링크의 절반 이상이 해당 결론을 실제로 뒷받침하지 못하는 “근거 없는 인용”으로 분류됐다.

 

페이스북·레딧에 기댄 ‘자신감 있는 헛소리’

 

오우미의 데이터에 따르면 AI 개요가 인용하는 출처 가운데 페이스북과 레딧이 각각 두 번째와 네 번째로 많이 등장했다. 특히 페이스북은 부정확한 답변의 7%에서 인용된 반면, 정확한 답변에서는 5%만 인용돼, 플랫폼별 출처 편중이 오류를 증폭시키는 경향도 드러났다.

 

구글이 내부 테스트에서 공개한 바에 따르면, 제미나이 3(Gemini 3) 모델은 구글 검색 프레임워크와 분리된 환경에서 최대 28%의 오탐(false positive)률을 보인 것으로 나타났다. 구글은 AI 개요가 잘못된 정보를 제공하는 경우에 대해 “쿼리를 잘못 해석했거나, 웹상의 언어적 뉘앙스를 잘못 이해했거나, 혹은 적절치 않은 출처를 끌어왔기 때문”이라며 시스템 보완 작업을 진행 중이라고 설명했지만, 대중의 신뢰 회복에는 시간이 필요해 보인다.

 

‘검색 혁신’에서 ‘검색 리스크’로


구글 검색은 전 세계 20억명 이상이 사용하는 사실상의 글로벌 정보 인프라로 평가받는다. 뉴욕타임스는 “AI 개요의 허위 답변이 20억명 이상의 사용자를 가진 검색엔진에 대한 신뢰를 떨어뜨리고 있다”고 지적했고, CNN은 “자신감 넘치는 AI의 허위 진술이 구글 브랜드 가치를 훼손할 위험성을 보여준다”고 진단했다.

 

한편 언론과 미디어 단체들은 AI 개요·AI 모드가 언론사 사이트로 이어지는 클릭을 잠식해 뉴스 생태계를 위협하고 있다며, ‘콘텐츠 절도’에 가깝다는 강경한 표현까지 동원해 비판 수위를 높이고 있다. 검색 쿼리 상단에 AI가 요약한 한 줄 답변이 자리 잡는 순간, 그 답이 틀렸을 경우의 사회적 비용 역시 기하급수적으로 커질 수밖에 없다는 경고다.

 

구조적 한계 인정이 ‘책임 있는 AI’의 출발점

 

구글은 2024년 5월 이후 AI 개요가 보여준 잇단 오류에 대해 알고리즘 개선과 품질 관리 강화 계획을 밝히며 진화에 자신감을 보이고 있다. 다만 문자 단위 인식, 출처 검증, 허위 정보 증폭 같은 문제는 ‘데이터를 조금 더 학습시키는 차원’을 넘어 아키텍처 설계와 서비스 철학 전반을 다시 짚어봐야 할 구조적 리스크에 가깝다는 게 연구자들의 공통된 견해다.

 

“Google”의 P 개수를 틀린 해프닝은 그 단면일 뿐, 실제로는 시간당 5,700만건의 오답이 검색 인프라를 타고 유통되는 시대가 이미 도래했다는 점에서, 이번 논란은 단순한 ‘망신살’이 아니라 검색 패러다임 전환기에 드러난 경고등으로 읽어야 한다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[빅테크칼럼] 한 주도 안 팔고 15년 버티니 스페이스X 30조 '잭팟'…3번 폭발 본 뒤에도 '믿음의 장투'

[뉴스스페이스=김정영 기자] 스페이스X 상장을 앞두고 15년간 ‘한 주도 안 판’ 초기 투자자 저스틴 피슈너 울프슨이 최대 30조원대 평가이익을 눈앞에 두면서, 장기 비상장 투자 전략의 상징적 사례로 부상하고 있다. 스페이스X가 예고대로 1조7700억달러 수준의 몸값으로 뉴욕 시장에 입성할 경우, 울프슨이 이끄는 137 벤처스는 단일 포지션으로만 200억달러(약 30조4000억원)에 달하는 지분 가치를 거머쥐게 된다. 15년 ‘노셀’ 버틴 벤처캐피털리스트 뉴욕타임스 등 외신 보도에 따르면, 샌프란시스코 기반 벤처캐피털 137 벤처스를 이끄는 저스틴 피슈너 울프슨(44)은 2011년부터 15년간 스페이스X 비상장 주식을 꾸준히 매입해 현재 회사 지분 1% 이상을 보유 중인 것으로 전해진다. 그는 스페이스X가 스타트업에 가깝던 시절, 직원 보유 지분과 구주 거래 등을 통해 물량을 모았고, 그 과정에서 단 한 주도 매도하지 않았다는 점이 투자 업계의 주목을 받고 있다. 울프슨은 “상장 첫날 주가는 네 배가 될 수도, 50% 떨어질 수도 있다”며 변동성을 경고하면서도, 여전히 “내가 믿는 회사”라며 장기 보유 의지를 드러냈다. 1조7700억달러 IPO, 200억달러

[이슈&논란] “이어캡은 팔면서 헤어밴드는 왜 안 파나”…애플 에어팟 맥스 이용자들의 불만 커지는 이유

[뉴스스페이스=이승원 기자] 애플의 프리미엄 헤드폰인 에어팟 맥스(AirPods Max)가 출시 6년차에 접어들면서 사용자들 사이에서 반복적으로 제기되는 불만이 있다. 바로 헤어밴드 메시(캐노피) 노화 문제다. 에어팟 맥스 헤어밴드 메시 노화 논란은 단순한 ‘미관 문제’를 넘어, 수리권·제품 수명·프리미엄 전략이 한 지점에서 충돌하는 사례로 부상하고 있다. 애플이 이어쿠션은 별도 판매하면서도, 구조적으로 분리 가능한 헤어밴드에 대해서는 여전히 공식 교체 부품과 소비자용 프로그램을 열지 않고 있다는 점이 이용자 불만의 핵심이다. “캐노피가 늘어진다”…6년 차에 본격화된 고질병 에어팟 맥스는 머리 위를 받치는 부분에 탄성 메쉬 캐노피 구조를 적용해, 출시 초기에는 “무게 대비 착용감이 뛰어나다”는 평가를 받았다. 그러나 출시 후 수년이 지나면서 해외 커뮤니티와 국내 게시판에는 “헤어밴드 메쉬가 늘어나 금속 프레임이 정수리를 직접 누른다”, “몇 분만 써도 정수리 통증이 온다”는 사례가 반복적으로 보고되고 있다. 특히 Reddit의 r/Airpodsmax 포럼과 애플 디스커션 게시판에는 “메쉬 탄성이 떨어지면서 머리 위에 철제 빔이 직접 닿는 느낌”이라는 불만이

[빅테크칼럼] 메타·마누스 20억달러 딜 '파기' 수순…중국, ‘완료된 M&A’도 뒤집는 AI 통제력 과시

[뉴스스페이스=이종화 기자] 메타 플랫폼스가 중국계 AI 스타트업 마누스(Manus)와의 데이터·시스템 연계를 전면 차단하면서, 20억달러(약 3조원) 규모로 성사됐던 인수 거래가 사실상 해체 국면에 들어갔다. 블룸버그 뉴스에 따르면, 메타 플랫폼스는 중국계 AI 스타트업 Manus와의 운영적 분리를 완료하고, 6월 초부터 모든 데이터 공유를 중단하는 동시에 Manus 직원들의 내부 시스템 접근을 전면 차단했다. 메타, 20억달러 베팅 뒤집힌 뒤 ‘데이터 셧다운’ 싱가포르에 본사를 둔 에이전틱(agentic) AI 서비스 마누스를 2025년 12월 말 약 20억달러(일부 외신은 20억~26억달러 범위로 보도)를 주고 통째로 인수했던 메타는, 불과 4개월 만에 중국 규제당국의 ‘철회 명령’을 맞았다. 중국 국가발전개혁위원회(NDRC) 외국인투자안전심사 판공실은 2026년 4월 말 성명을 통해 “법규에 따라 마누스에 대한 외국인 투자를 금지하고, 당사자들에게 인수 거래 철회를 요구한다”고 공식 발표했다. 블룸버그와 현지 매체에 따르면 메타는 6월 초부터 마누스와의 데이터 공유를 전면 중단했고, 마누스 직원들의 메타 내부 데이터·시스템 접근도 모두 차단했다. 메타