2025.12.31 (수)

  • 맑음동두천 -5.5℃
  • 맑음강릉 -1.3℃
  • 맑음서울 -3.5℃
  • 구름조금대전 -2.8℃
  • 맑음대구 -1.9℃
  • 맑음울산 -0.1℃
  • 맑음광주 -0.6℃
  • 맑음부산 1.6℃
  • 흐림고창 -3.1℃
  • 구름조금제주 7.0℃
  • 맑음강화 -4.7℃
  • 맑음보은 -5.9℃
  • 흐림금산 -3.2℃
  • 구름많음강진군 -2.5℃
  • 맑음경주시 -4.1℃
  • 구름조금거제 1.2℃
기상청 제공

산업·유통

KT, 한국적 AI ‘믿:음 2.0’ 오픈소스 공개…대한민국 AI 대중화 나선다

 

[뉴스스페이스=조일섭 기자] KT(대표이사 김영섭)가 ‘한국적 AI’의 철학을 담아 자체 개발한 언어모델(LLM) ‘믿:음 2.0’의 오픈소스를 AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 공개할 예정이라고 3일 밝혔다. 이 오픈소스는 기업과 개인, 공공 누구나 상업적으로 활용할 수 있도록 제약 없이 개방된다.

 

‘한국적 AI’는 KT의 AI 철학으로 한국의 정신과 방식, 지식을 기반으로 구현해 한국에 가장 잘 맞는 AI를 의미한다. 이를 위해 KT는 한국의 사회적 맥락과 같은 무형의 요소와 한국어 고유의 언어적·문화적 특성 등을 충분히 반영해 학습한 AI 모델을 개발하여 대한민국의 산업과 일상 속에서 AI가 자연스럽게 스며들어 대중화될 수 있도록 앞장서고 있다.

 

KT의 믿:음은 사전 학습부터 자체적으로 만든 한국적 독자 AI 모델로서 고품질 한국어 데이터를 준비하는 과정에서 모든 저작권을 확보하여 신뢰성을 높였다. 2023년 믿:음 1.0 버전의 Standard, Premium 2종을 출시한 이래 KT AICC(AI 고객센터), 지니TV, AI 전화, 100번 고객센터 등 다양한 서비스에 폭넓게 활용해 왔다.

 

이번에 KT가 한국적 AI라는 철학을 담아 새롭게 선보이는 믿:음 모델은 ▲115억 파라미터 규모의 ‘믿:음 2.0 Base’ ▲23억 파라미터 규모의 ‘믿:음 2.0 Mini’ 2종으로 모두 한국어와 영어를 지원한다. 믿:음 2.0 Base는 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반의 질의 응답에서 강력한 성능을 나타낸다.

 

믿:음 2.0 Mini는 Base 모델에서 증류한 지식을 학습한 소형 모델이다. 110억 파라미터 이상의 한국어 범용 LLM을 누구나 상업적으로 활용할 수 있는 오픈소스로 공개한 것은 KT가 처음으로 국내 AI 생태계 활성화에 긍정적인 역할을 할 수 있을 것으로 기대된다.

 

믿:음 모델은 한국어와 한국 문화 및 사회 등의 전문 분야에서 기존의 국내외 주요 모델을 상회하는 이해력과 생성 성능을 입증했다. KT와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표인 ‘Ko-Sovereign(코-소버린)’ 벤치마크에서 유사 규모의 국내 기성 모델을 비롯해 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했다. Ko-Sovereign은 한국적 AI 성능을 종합적으로 평가할 수 있도록 언어, 문화, 사회, 역사 등의 한국적 맥락을 정밀하게 반영한 전문가 수준의 문항으로 구성됐다.

 

이와 함께 한국과 관련한 전문 지식의 이해도를 측정하는 대표적 벤치마크 ‘KMMLU’와 한국어 언어모델 평가 지표인 ‘HAERAE’에서도 믿:음은 국내외 주요 오픈소스 모델보다 더 우수한 성능을 기록했다.

 

KT는 국내 교육용 도서와 문학 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 다양한 산업·공공·문화 영역에서 방대한 한국 특화 데이터를 확보해 믿:음 2.0 학습에 활용했다. 또 저작권 이슈가 있는 데이터는 모두 제거하는 등 KT의 Responsible AI 원칙에 따라 고품질 데이터를 선별하여 가공했다.

 

이외에도 한국어의 구조와 언어학적 특성을 반영한 토크나이저(Tokenizer)를 자체 개발하고, 필터링으로 줄어든 데이터 규모는 데이터 합성 방법론을 적용해 보완했다. 이를 통해 한국 사회 고유의 언어와 문화적 맥락을 정교하게 반영하여 한국어 사용자에 최적화된 언어 이해 능력과 정밀한 표현력을 지닌 모델로 구현했다. 고려대학교 민족문화연구원과의 산학 협력을 통해 ‘한국적 AI’로서 믿:음 2.0의 학술적 신뢰도도 확보했다.

 

특히 KT는 믿:음 2.0은 AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용해 보다 안전하고 투명한 기술을 구현하는 데 힘썼다.

 

또 믿:음 개발 단계에서 리벨리온과 긴밀히 협력하며 국산 AI 반도체에서의 동작을 최적화했고, 프렌들리AI와 함께 사용자가 별도의 설치 과정 없이도 허깅페이스를 통해 무료로 편리하게 체험해볼 수 있는 환경도 한시적으로 제공한다.

 

KT는 믿:음 2.0을 공개하며 본격적으로 국내 AI 생태계에 ‘한국적 AI’ 확산 선도에 나선다. 마이크로소프트와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델 또한 순차 공개할 예정이다.

 

앞서 KT는 자체 개발한 모델 ‘믿:음’, 글로벌 기업들의 SOTA(State of the Art, 현존 최고 수준 모델) 등을 두루 활용하여 한국의 특수성을 반영한 AI 모델에 집중 투자하고 국내 사용 환경에 특화한 AI의 대중화에 앞장서겠다고 밝혀온 바 있다. 국내 공공 및 민간 여러 분야에서 AI를 활용한 혁신을 주도하며 국가 AI 경쟁력 제고에 기여한다는 복안이다.

 

KT Gen AI Lab장(CAIO) 신동훈 상무는 “믿:음 2.0은 일반적인 생성 능력을 갖추면서도 한국의 문화와 언어를 깊이 이해하도록 고도화된 AI 모델”이라며, “이는 KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것”이라고 말했다.

배너
배너
배너

관련기사

93건의 관련기사 더보기


[이슈&논란] 참여연대 “쿠팡의 5만원 쿠폰은 국민기만 행위, 쿠팡방지3법 제정하라"…형식적 사과에 계산된 마케팅 '뿔났다'

[뉴스스페이스=김정영 기자] 쿠팡이 3,370만명의 개인정보 유출 사건에 대한 보상책으로 1인당 5만원 상당의 구매 이용권을 지급하겠다고 발표했지만, 시민단체는 이를 “국민기만 행위”라고 강하게 비판하고 나섰다. 참여연대는 12월 29일 오전 발표한 논평에서 “현금이 아닌 쿠폰 형태의 보상은 피해 회복이 아니라 자사 매출 확대를 위한 꼼수일 뿐”이라며 김범석 의장과 해롤드 로저스 대표의 즉각적인 사과와 실질적 보상안을 요구했다. 쿠팡의 ‘5만원 쿠폰’, 국민 신뢰 회복 아닌 또 다른 기만…피해 회복 아닌 강제 소비” 참여연대는 쿠팡이 내놓은 5만원 이용권이 사실상 소비 유도형 마케팅에 불과하다고 지적했다. 쿠팡 멤버십 유료 회원이 아니라면 해당 이용권을 제대로 활용하기 어렵고, 상품 구매 시에도 추가 결제를 해야 하는 구조라는 것이다. 결국 피해자가 피해보상을 받는 것이 아니라, 쿠팡 매출에 기여하도록 유도되는 셈이다. 또한 쿠팡은 트래블·럭셔리(알럭스) 서비스용 쿠폰을 각각 2만원씩 지급하기로 했는데, 참여연대는 이를 “보상 쪼개기로 실질적 가치와 선택권을 축소한 꼼수”라고 표현했다. 이는 보상보다는 부수 서비스의 점유율을 높이려는 전략적 마케팅에 가깝다는

[이슈&논란] 美 쿠팡의 '5만원 쿠폰 쇼'에 한국 국민 희롱 당하다…개인정보 털린데 이어 무책임 마케팅에 이용까지 '2차 희생' 빈축

[뉴스스페이스=김희선 기자] 쿠팡이 3370만 고객의 대규모 개인정보 유출 사태 한 달 만에 내놓은 '보상안'은 1인당 5만원 상당 구매 이용권이다. 하지만 이는 현금성 포인트가 아니라 서비스별 쪼개진 쿠폰 형태다. 이번 조치는 피해자들의 실질적 고통을 외면한 채 자사 플랫폼 이용을 강요하는 상술로 비쳐지며, 또 다시 한국 소비자를 우롱했다는 논란이 폭발하고 있다. 쿠팡 내부 지침에서조차 '보상'이라는 단어를 금지한 쿠팡의 태도는 국민을 단순한 상업적 이용 대상으로 전락시킨 증거라는 의견이 대다수다. ​ 쪼개기 쿠폰의 실체…고객 "이용률 낮은 서비스로 억지 구매유도? 쿠폰 80% 쓰레기 서비스" 쿠팡의 구매 이용권은 총 5만원으로 구성되지만, 핵심 서비스인 로켓배송·로켓직구 등 쿠팡 쇼핑과 쿠팡이츠에 각각 5000원씩(총 1만원)만 배정됐다. 반면 이용률이 낮은 쿠팡트래블과 알럭스(럭셔리 뷰티·패션)에 각 2만원씩(총 4만원)을 쏟아부어, 고객들이 평소 안 쓰는 서비스에서 억지로 소비하도록 유도한다. 소비자들은 "사실상 1만원 보상"이라며 "보상 탈 쓴 마케팅"으로 규탄하고 있으며, 온라인 커뮤니티에서 "장난하냐", "소비자 희롱" 반응이 봇물을 이룬다. ​

[이슈&논란] 한샘·현대리바트·에넥스 등 48개 가구업체, 입찰담합 과징금 250억원 부과···공정위, 무더기 '철퇴'

[뉴스스페이스=김희선 기자] 공정거래위원회는 에넥스, 한샘, 현대리바트 등 48개 가구 제조·판매업체가 아파트 빌트인·시스템 가구 입찰에서 2013년부터 2022년까지 9년간 총 333건의 프로젝트를 대상으로 조직적 담합을 벌인 혐의로 시정명령과 함께 250억원의 과징금을 부과했다. 가구업계 '제비뽑기 담합' 판결: 9년간 3.6조 불법 이익에 1400억 과징금 폭탄 이번 제재로 가구업계 누적 과징금은 1427억원에 달하며, 관련 매출액은 3조6354억원 규모로 집계됐다. 국내외 매체 보도에 따르면 이들 업체는 건설사 67곳의 입찰에서 낙찰자를 미리 정하고 가격을 공유하는 방식으로 공정 경쟁을 저버렸다. ​ 담합 방식: 모임·전화·사다리타기로 낙찰 순번 배분 가구업체들은 영업담당자 모임이나 전화 연락을 통해 낙찰예정자를 선정하고, 합의된 견적가격을 들러리 업체에 공유한 뒤 동일 금액으로 투찰하게 했다. 일부 업체는 제비뽑기나 사다리타기 같은 비공식 방법으로 순번을 정해 번갈아 가며 낙찰받는 '회전 담합'을 실행했다. 빌트인 특판가구(싱크대·붙박이장 등) 부문에서는 35개 업체가 54개 건설사의 240건 입찰(2013~2022), 시스템 가구(드레스룸·팬트리

SK케미칼, 넥스트젠바이오와 AI 신약 공동개발 전면전…전주기 협력 체계 구축

[뉴스스페이스=김혜주 기자] SK케미칼이 국내 AI 신약 개발 선도기업 넥스트젠바이오사이언스와 신약 공동개발을 위한 업무협약(MOU)을 체결하며, 바이오·제약 산업의 혁신을 주도할 전주기 협력 체계를 구축했다. 양사는 12월 26일 신규 신약 과제 발굴 및 공동 연구개발 협력 강화를 공식화하며, 치료 옵션이 부족한 질환 분야를 중심으로 신약 후보물질을 공동 발굴하고, 연구 협력을 본격 확대할 계획이라고 밝혔다. ​ 협약의 핵심: 신약 R&D 전주기 공동 협력 이번 협약은 △신규 신약 과제 공동 도출 △공동연구 과제의 양사 공동 수행 △연구 시설 및 장비 공동 활용 △연구 인력·기술·정보 교류 등 신약 연구개발(R&D) 전반에 걸친 협업을 추진하는 것이 핵심이다. 초기 후보물질 탐색 단계부터 비임상, 임상 개발까지 전 과정에 걸친 협력 가능성을 검토하고, 단계별 공동연구 과제를 도출해 신약 개발 속도를 가속화한다는 방침이다. ​ 넥스트젠바이오, AI 플랫폼 ‘파이브레인’ 기반 신약 파이프라인 확대 넥스트젠바이오사이언스는 2018년 설립된 바이오기업으로, 자가면역질환과 섬유증 질환 치료제 개발에 특화돼 있다. 자체 개발한 AI 신약개발 플랫폼 ‘파

[이슈&논란] 쿠팡 일방적 자체 발표에 과기부 강력 항의…정부 긴급회의 소집하며 총력 대응 '확전양상'

[뉴스스페이스=김희선 기자] 성탄절인 25일, 대통령실이 쿠팡의 대규모 개인정보 유출 사태에 대응하기 위해 범정부 관계장관 회의를 긴급 소집했다. 회의에는 과학기술정보통신부 장관, 개인정보보호위원장, 공정거래위원장, 국세청장 등이 참석했으며, 외교부 장관과 국가안보실 관계자 등 외교·안보 라인 인사들도 포함돼 쿠팡의 미국 로비 의혹과 한미 간 통상 문제로 비화할 가능성까지 고려한 조치로 풀이된다. ​ 쿠팡은 이날 자체적으로 “유출자를 특정하고 관련 장비를 회수했으며, 실제 저장된 정보는 약 3000개 계정에 그쳤고 외부 전송은 없었다”고 발표했다. 그러나 과기정통부는 “정보 유출의 종류와 규모, 유출 경위 등은 현재 민관합동조사단이 면밀히 조사 중인 사항”이라며 “조사 중인 사항을 쿠팡이 일방적으로 대외에 알린 데 대해 강력히 항의했다”고 밝혔다. 쿠팡의 개인정보 유출 규모는 사실상 전 고객을 포함하는 초대형 사고로, 지난 29일 쿠팡은 고객 계정 약 3370만개가 무단으로 노출된 것으로 확인됐다고 발표했다. 유출된 정보에는 이름, 이메일, 배송주소, 전화번호, 일부 주문 정보, 공동현관 출입번호 등이 포함됐으며, 결제정보나 신용카드 번호, 로그인 정보는 유