[뉴스스페이스=이종화 기자] 지난 1년간 전 세계에서 내려받은 신규 오픈소스·오픈웨이트 AI 모델 가운데 중국산이 17%를 차지해, 15.8%에 그친 미국 개발자 모델을 처음으로 앞질렀다.
매사추세츠공과대(MIT)와 허깅페이스(Hugging Face)의 공동 분석에 따른 집계에는 중국의 딥시크(DeepSeek), 알리바바의 ‘췐(Qwen)’ 계열, 즈푸(Zhipu), 키미(Kimi) 등 주요 팀이 올린 모델들이 포함되며, 특히 딥시크와 Qwen 계열이 중국산 다운로드의 절대비중을 차지하는 것으로 나타났다.
geekwire.com, allenai.org, scmp.com, businesswire.com, ai-frontiers, thewirechina에 따르면, 중국산 모델은 단순 점유율뿐 아니라 사용자 체감 성능에서도 존재감을 키우고 있다. 글로벌 크라우드소싱 평가 플랫폼인 디자인 아레나(Design Arena) 기준으로 2025년 상위 16위 오픈소스 AI 모델을 모두 중국계 모델이 차지해, 메타 Llama 계열 등 서방 오픈모델을 사용자 경험 측면에서 완전히 추월했다는 평가가 나온다.
DeepSeek·Qwen, “싸고 잘 돌아가는” 다크호스로
중국 오픈소스 붐의 상징은 딥시크 R1·V3와 알리바바 Qwen 패밀리다. 딥시크는 비교적 저사양 GPU와 약 500만달러 수준의 학습비용으로 챗GPT-3급 추론 성능을 구현했다고 알려지면서 공개 직후 엔비디아 시가총액이 하루 새 650억달러 증발하는 ‘딥시크 쇼크’를 낳았다.
알리바바는 자체 추산 기준 Qwen 기반 파생 모델이 17만개 이상 올라왔다고 밝힐 정도로 생태계를 키우며, 허깅페이스에 업로드되는 신규 파생 모델 수에서 메타 Llama를 제치고 선두권을 유지하고 있다.
중국 내에서도 딥시크의 독주를 Qwen이 빠르게 추격하는 양상이다. 중국 클라우드 플랫폼 PPIO 통계에 따르면 2024년 1분기 99%에 달하던 딥시크 모델 사용 비중은 6월 80% 수준으로 떨어졌고, 나머지를 알리바바 Qwen과 기타 신흥 모델들이 나눠 갖고 있다. 이는 단일 모델의 압도적 독점이 아닌, 다수 오픈모델이 병렬적으로 진화하는 구조가 형성되고 있음을 시사한다.
실리콘밸리 스타트업, “중국 모델이 더 싸고 유연하다”
비용과 유연성은 스타트업 선택을 결정짓는 핵심 변수다. 미국 VC 앤드리슨 호로비츠(a16z)의 파트너 마틴 카사도는 “최근 피치를 들여다보면, 오픈소스 모델을 쓰는 스타트업 가운데 최고 80%가 중국산 오픈소스 모델을 쓴다”고 지적했다. 이후 그는 “전체 스타트업의 20~30%가 오픈모델을 쓰고, 그 중 80%가 중국 모델”이라는 의미였다고 정정했지만, 그 자체로 미국 내 신생 AI 기업의 16~24%가 중국 오픈모델 위에 비즈니스를 짓고 있다는 뜻이다.
스타트업들이 중국 모델을 택하는 이유는 명확하다. 첫째, 가격 대비 성능이다. 미국·유럽 벤처 전문매체는 중국산 오픈웨이트 모델들이 “서방 모델 대비 돈 대비 가치가 더 좋다”며, API 과금 구조에 민감한 초기 기업들에게 사실상 ‘당연한 선택지’가 되고 있다고 전한다.
둘째, 온프레미스와 데이터 주권이다. 공개된 가중치와 라이선스를 활용해 자사 인프라에 직접 모델을 올려 쓸 수 있어, 의료·금융·정부 등 규제 산업에서 데이터 위치와 통제를 엄격히 요구하는 수요와 잘 맞아떨어지고 있다.
중국 기업들은 미국의 엔비디아 칩 수출 규제 이후 ‘적은 연산으로 비슷한 성능’을 내는 효율화와 경량화 전략을 집요하게 밀어붙였다. 반면 미국 빅테크는 수십억·수백억달러 단위 데이터센터 투자를 전제로 한 초거대 모델 경주에 자본을 집중시키는 구조이며, 이 간극이 오픈소스·오픈웨이트 영역에서 중국의 속도 우위를 낳고 있다는 분석이 이어진다.
딥시크, 정치 트리거에 취약한 코드 더 많이 생성
그러나 중국산 오픈모델의 급부상은 동시에 새로운 보안 리스크를 노출시키고 있다. 사이버보안 기업 크라우드스트라이크(CrowdStrike)가 11월 발표한 분석에 따르면, 딥시크의 대표 모델 DeepSeek-R1은 일반적인 코딩 작업에서는 서방 경쟁 모델에 필적하는 수준의 코드를 생성하지만, “티베트(Tibet)·위구르(Uyghurs)·파룬궁(Falun Gong)” 등 중국 공산당에 민감한 정치 키워드를 프롬프트에 포함할 경우 심각한 보안 취약점이 포함된 코드 비율이 최대 50%까지 높아지는 것으로 나타났다.
특히 “티베트에 위치한 산업 제어 시스템용 코드를 작성하라”는 식으로 지시했을 때, 중대한 취약점을 포함한 코드 생성 비율이 27.2%까지 치솟아, 중립 프롬프트 대비 약 50% 증가했다는 수치가 제시됐다. 연구진은 이러한 현상이 단순한 학습 데이터 부족이 아니라, 중국 규제에 맞춘 ‘내장 검열·가드레일’이 모델 가중치 수준에서 동작하면서 비우연적 편향과 코드 품질 저하를 유발한 결과일 가능성이 높다고 지적한다.
이념 정렬·검열 논란…“코드뿐 아니라 서사도 편향”
콘텐츠 생성 영역에서도 중국 모델의 이념적 편향과 검열 문제는 꾸준히 제기돼 왔다. 허깅페이스와 테크크런치 등 서방 개발·IT 커뮤니티에선 일부 Qwen 계열과 딥시크 모델이 천안문 사건, 대만 문제 등 중국 정부가 민감하게 여기는 주제에 대해 답변을 회피하거나 서술을 왜곡하는 사례가 반복 보고되고 있다.
예컨대 특정 Qwen 파생모델은 ‘천안문 사태’를 직접적으로 언급하는 질문에 응답을 차단하는 반면, 같은 시기 다른 모델은 일반적인 1980년대 중국 현대사 개요는 비교적 정상적으로 생성하는 식의 이중적 행태를 보였다는 사례도 공유됐다.
딥시크의 경우도 정치·종교 민감 키워드가 들어간 코드·텍스트 요청에 대해 내부적으로는 비교적 상세한 추론 계획을 세우면서, 최종 출력 단계에서 “도움을 줄 수 없다”는 짧은 거부 문구만 내보내는 패턴이 포착됐다는 분석이 나왔다. 이는 외부 필터가 아니라 모델 내부에 검열 규칙이 각인돼 있을 가능성을 뒷받침하며, 허깅페이스 CEO 클레망 들랑그는 서방 기업들이 이런 모델에 의존할 경우 ‘중국식 검열과 내러티브’가 글로벌 디지털 공간으로 수출될 위험을 경고했다.
미국의 응수: 완전 개방형 ‘Olmo 3’
미국도 손을 놓고 있는 것은 아니다. 앨런 인공지능연구소(AI2)는 11월 ‘Olmo 3’라는 완전 오픈소스 대규모 언어모델 패밀리를 공개하며, 데이터부터 학습 코드, 체크포인트, 추론 단계까지 소위 ‘모델 플로우’를 전면 공개하는 강수를 뒀다. Olmo 3는 7B·32B 등 다양한 크기로 제공되며, 특히 320억 파라미터급 추론 특화 모델은 “현재 공개된 모델 중 가장 강력한 사고(Thinking)형 완전 오픈모델”이라는 평가를 받으면서 중국발 오픈모델 일색인 상위권에 미국산 대항마를 세우려는 포석으로 해석된다.
AI2는 Dolma 3라는 6조 토큰 규모 공개 데이터셋과 함께 모델 학습 과정을 투명하게 공개함으로써, 연구 재현성과 검증 가능성을 극대화하고자 한다고 강조했다. 이는 가중치·데이터·코드 대부분이 불투명한 상태로 공개되는 중국·일부 서방 오픈웨이트 모델과 차별화를 노린 행보로, “성능뿐 아니라 ‘검열·편향’을 포함한 모델 거버넌스까지 투명하게 검증해야 한다”는 서방 학계·시민사회 요구에 대한 응답 성격도 담고 있다.
수출통제와 ‘효율전쟁’…미·중 AI 패권의 새 전선
전문가들은 칩 수출통제가 오히려 중국의 오픈모델 경쟁력을 자극하는 역설적인 효과를 낳았다고 진단한다. 2022년 이후 미국·일본·네덜란드가 잇따라 첨단 반도체 장비·AI 칩에 대한 대중(對中) 통제를 강화한 결과, 중국은 엔비디아 고급 칩을 충분히 확보하지 못해 AI 칩 생산에서 “주변부 플레이어”에 머물고 있지만, 그 대신 소수 칩으로 최대 성능을 뽑아내는 소프트웨어·알고리즘 최적화에 집중하게 됐다는 것이다.
그럼에도 미국의 수출통제가 중국 모델의 품질 향상을 근본적으로 막지는 못했다는 평가가 최근 연구에서 제시된다. AI 정책 싱크탱크 보고서는 화웨이가 2025년 생산할 수 있는 AI 칩 수량을 20만개 수준으로 추산하는 한편, 중국이 2024년에만 엔비디아가 중국 시장용으로 다운그레이드한 칩을 100만개가량 합법적으로 수입했다고 전하며, “훈련용 연산력은 여전히 확보되고 있다”고 분석했다.
다만 딥시크가 R1 공개 직후 API 접속을 제한해야 했던 사례에서 보듯, 고급 칩 부족은 모델 훈련보다는 대규모 상용 서비스 단계에서 병목으로 작용할 소지가 크다는 지적도 함께 나온다.
“다운로드 1위, 그러나 신뢰·보안은 별개 과제”
중국산 오픈소스 AI가 다운로드와 사용자 경험 평가에서 미국을 앞선 것은 분명한 분기점이지만, 서방 안보·기술 커뮤니티의 시각은 복합적이다. 신미국안보센터(CNAS)와 영국 채텀하우스 등은 “저렴한 중국 모델이 미국 스타트업과 공공부문 시스템 곳곳에 침투할 경우, 코드·콘텐츠에 심어진 이념 편향과 숨은 취약성이 공급망 리스크로 전이될 수 있다”고 경고한다.
허깅페이스 CEO와 크라우드스트라이크, 각국 사이버보안 연구자들은 “중국 오픈모델의 성능과 효율은 인정하되, 이를 채택하는 조직은 최소한 소스 코드 검증·보안 점검·정책 편향에 대한 별도 리스크 관리 체계를 구축해야 한다”고 입을 모은다.
중국이 다운로드와 생태계 확장에선 미국을 추월했지만, 글로벌 AI 표준 경쟁의 최종 승부는 “얼마나 싸고 빠른가”가 아니라 “얼마나 안전하고 신뢰할 수 있는가”에서 갈릴 것이라는 진단이 설득력을 얻고 있다.























































