[뉴스스페이스=윤슬 기자] 거대언어모델(LLM) 기반 인공지능(AI) 챗GPT를 만드는 오픈AI가 텍스트를 입력하면 동영상을 만들어주는 AI서비스 ‘소라(Sora)’를 공개했다.
15일(현지 시각) 오픈AI는 자사 홈페이지를 통해 "실제 상호작용이 필요한 문제를 해결하는 데 도움이 되도록 움직이는 물리적 세계를 이해하고 시뮬레이션할 수 있도록 AI를 교육하고 있다"면서 '텍스트 투 비디오(Text to Video)' 모델인 소라를 공개했다.
소라는 최대 1분 길이의 동영상을 생성할 수 있다. 다른 텍스트 투 비디오 플랫폼에 비해 시각적 품질이 좋고 프롬프트의 내용에 충실한 그림을 그려주는 게 특징이다.
업계 전문가들은 단순한 텍스트 해석을 넘어서, 주어진 시나리오를 시각화하고 실제와 유사한 환경을 구현했다는 점에서 높은 점수를 주고 있다.
아울러 폭 넓은 창의적 활용도는 물론 다양한 환경과 상황을 현실감 있게 재현하는 툴을 제공했다는 점에서 '챗GPT'에 이어 오픈AI가 또 한 번의 혁신을 가져올 것으로 예상하고 있다.
오픈AI는 ‘세련된 여성이 따뜻하게 빛나는 네온사인과 움직이는 도시 간판으로 가득한 도쿄 거리를 걷고 있습니다. 그녀는 검은색 가죽 재킷, 긴 빨간색 드레스, 검은색 부츠를 착용하고 검은색 지갑을 들고 있습니다. 선글라스와 빨간 립스틱을 착용하고 있습니다. 그녀는 자신감 있고 자연스럽게 걷습니다. 길은 축축하고 반사되어 화려한 조명이 거울 효과를 만들어 냅니다. 많은 보행자가 걸어갑니다’라는 세부적인 명령에 맞춰 만들어진 영상을 공개했다.
소라는 텍스트 설명만으로 동영상을 생성할 수 있고, 기존의 정지 이미지를 통해서도 동영상을 생성할 수 있다. 또한 기존 동영상을 가져와서 확장하거나 누락된 프레임을 채우는 기능도 갖췄다.
하지만 우려도 만만치 않다. 소셜미디어(SNS) 등에서 딥페이크로 인한 피해가 이어지는 가운데, 기술 오용과 가짜 정보 유통에 대한 우려때문이다.
이미 오픈AI는 생성AI 챗봇 '챗GPT'와 명령어를 통해 이미지를 구현하는 AI 서비스 '달리'를 출시한 바 있다. 이제 소라의 출시를 통해 생성형 비디오 AI 서비스까지 사업을 넓힌 것이다. 소라는 달리를 기반으로 비디오를 생성하는 서비스로, 원하는 장면을 묘사한 명령어를 입력하면 고화질 영상 클립으로 만들어준다.
CNBC 등 주요 외신은 "오픈AI의 비디오 AI 서비스는 생성형 AI 산업의 차세대 개척자가 될 수 있지만, 심각한 가짜 정보 문제를 야기할 수 있다"고 언급했다. 특히 전 세계 주요 선거를 앞두고 이 같은 기술에 대한 우려는 더 커지고 있는 상황이다. CNBC는 AI분석업체 클래리티의 데이터를 근거로 AI로 생성된 딥페이크 수가 전년 대비 900% 폭증했다고 보도했다.
이 같은 우려에 대해 오픈AI는 취약점을 테스트하는 '레드 팀' 구성원들과의 협력을 통해 감별 기술을 마련하겠다고 밝혔다.
아울러 "극단적인 폭력‧성적 콘텐츠, 혐오 이미지, 유명인의 초상화 사용 등의 내용을 명령어로 사용할 경우 요청을 거부하게 할 것"이라며 "생성된 모든 비디오를 검토해, 표시되기 전 사용 정책을 준수하는지 확인하겠다"고 설명했다.