2026.01.14 (수)

  • 흐림동두천 -12.5℃
  • 구름조금강릉 -5.2℃
  • 맑음서울 -9.0℃
  • 맑음대전 -6.6℃
  • 맑음대구 -3.9℃
  • 맑음울산 -3.8℃
  • 구름많음광주 -3.2℃
  • 맑음부산 -1.1℃
  • 맑음고창 -5.4℃
  • 맑음제주 2.7℃
  • 흐림강화 -11.6℃
  • 맑음보은 -9.3℃
  • 맑음금산 -7.5℃
  • 구름많음강진군 -2.9℃
  • 맑음경주시 -5.9℃
  • 맑음거제 -0.3℃
기상청 제공

빅테크

AI(인공지능) 검색 도구 중 가장 정확한 답을 내는 AI 모델은? ‘구글’ 1위…워싱턴포스트 9대 AI 정밀평가

 

[뉴스스페이스=김정영 기자] 워싱턴포스트(WP)가 미국 공공·대학도서관 사서들과 함께 AI 검색 도구의 답변 정확도를 전격 비교 평가한 결과, 구글의 ‘AI 모드’가 100점 만점에 60.2점으로 1위를 기록했다.

 

이번 평가는 GPT-5 기반 오픈AI의 챗GPT(55.1점), 퍼플렉시티(51.3점), 빙 코파일럿(마이크로소프트), 클로드(앤스로픽), 메타AI, 일론 머스크의 그록 등 총 9개 인공지능을 대상으로 30가지 고난도 질의에 대해 900건 답변을 평가하는 방식으로 집계됐다.

 

세부 분야별로는 구글 AI 모드가 퀴즈(일반정보)와 최신 사건 부문에서 가장 두각을 나타냈고, 전문자료 탐색 부문에서는 MS 빙 코파일럿이, 이미지 인식 부문에서는 퍼플렉시티가 각각 우위를 보여 각 AI마다 특화 분야가 드러났다.

 

하위권에는 ‘그록3’(40.1점), ‘메타AI’(33.7점) 등이 자리했으며, WP는 “AI가 여전히 정보 최신성·신뢰성 판단과 비판적 사고 대체에는 한계가 있다”고 지적했다.

 

2025년 상반기 전 세계 AI 검색엔진 월간 방문자는 챗GPT 38억회, 딥시크(DeepSeek) 2.78억회, 구글 제미나이(Google Gemini) 2.68억회, 퍼플렉시티(Perplexity AI) 1억회로 집계됐으며, GPT-5, 구글 AI 모드, 퍼플렉시티 등 주요 도구는 인간의 퀴즈·전문검색·이미지 인식 대응력을 중심으로 진화를 거듭하고 있다. 실시간 웹 검색, 출처 인용 등의 특화 기능으로 학생·전문직에서 Perplexity AI가 특히 주목받고 있다는 평가도 나온다.

 

WP 평가는 실사용에서 AI 도구별로 ‘정확도(accuracy)’와 ‘실제 활용도’의 차이가 있음을 드러냈는데, 예를 들어 챗GPT 5와 구글 AI 모드는 평균 80% 내외의 논리 정확도를 보였다. 사용자는 AI 도구의 답변을 맹신하기보단 “각각의 강점·약점을 파악하고, 항상 출처와 최신성, 비판적 검증 과정을 거쳐야 한다”는 현장의 목소리가 높았다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 이란 '전자전' 돌입…스타링크 패킷 80% 차단, 반정부 시위 영상 유포 막기 '안간힘'

[뉴스스페이스=김정영 기자] 이란 정부가 반정부 시위 진압 과정에서 일론 머스크의 스타링크 위성 인터넷을 겨냥한 군용 전파 교란을 강화하며 '전자전'에 돌입했다. 수도 테헤란 서부 지역에서 드론을 동원해 지붕 위 스타링크 안테나를 수색·압수하는 대규모 작전을 펼치고 있다. 인터넷 감시단체 넷블록스에 따르면, 1월 8일부터 이란 전역 인터넷 접속률이 평소 수준의 1% 또는 5%까지 급락하며 100시간 이상 '디지털 블랙아웃' 상태가 지속되고 있다. ​ 스타링크, 밀수입 단말기 10만대…시위 영상 외부 유포 '라이프라인' 이란 내 스타링크 사용자 수는 10만명을 초과하며, 지난 1년간 20배 증가한 것으로 추정된다. 전자상거래협회 관계자는 고유 사용자 3만명 이상이 월 700~2,000달러를 지불하며 위성 인터넷을 이용한다고 밝혔다. 시위 현장에서 촬영된 영상을 스타링크로 외부 제3자에게 전송해 소셜미디어에 게시하는 방식으로 정보가 전 세계에 확산되고 있다. ​ 미안그룹의 아미르 라시디 디지털권리 전문가는 "시위 집중 지역에서 스타링크 패킷 손실률이 30%에서 80%까지 치솟았다"며 정부의 이동식 재머 사용을 지적했다. 스페이스X는 소프트웨어 업데이트로 테헤란