[빅테크칼럼] 인간의 마음을 읽는 AI, ‘센타우르’의 혁신…1000만건의 데이터로 인간행동 '예측'

[뉴스스페이스=윤슬 기자] AI가 이제 인간의 선택까지 밝혀낼 전망이다.

독일 헬름홀츠 뮌헨 연구진이 개발한 인공지능(AI) 모델 ‘센타우르(Centaur)’가 전 세계 인지과학계와 AI 업계의 이목을 집중시키고 있다고 Nature, Science, TechXplore의 매체들이 연이어 보도했다.

센타우르는 160종 심리학 실험에서 6만92명의 참가자가 남긴 1068만건 이상의 선택 데이터를 학습해 인간의 의사결정과 행동을 전례 없는 정확도로 예측하는 능력을 보여준다. 이 모델은 기존 심리학 이론이나 통계 모델을 뛰어넘어, 완전히 새로운 상황에서도 인간의 선택을 예측할 수 있다는 점에서 ‘가상 실험실’로 불린다.

'Psych-101' 세계 최대 규모의 심리 실험 데이터셋

센타우르의 기반이 된 ‘Psych-101’ 데이터셋은 자연어로 전사된 160개 심리 실험의 데이터로, 각 실험의 텍스트, 실험 고유 식별자, 참가자 식별자 등 표준화된 구조를 갖춘다. 데이터셋 내 인간의 응답은 “>” 토큰으로 표시되어, AI 모델이 쉽게 학습할 수 있도록 설계됐다.

이 방대한 데이터는 실제로 1060만건이 넘는 인간의 선택을 포함하며, 이는 기존 인지과학 연구에서 찾아보기 힘든 규모다.

연구팀은 여기서 그치지 않고, 약 100만명의 참가자와 1억건의 선택 데이터를 목표로 하는 ‘Psych-201’ 프로젝트를 추진 중이다. 이 확장 프로젝트가 완성되면, 심리학적 맥락의 다양성과 인지모델의 정밀도가 한층 강화될 전망이다.

완전히 새로운 상황에서도 ‘인간처럼’

센타우르가 기존 모델과 가장 크게 차별화되는 지점은 ‘일반화 능력’이다. 기존 심리학 모델들은 특정 영역(예: 도박, 기억 게임 등)에서만 뛰어난 성과를 보였지만, 센타우르는 문제 구조가 바뀌거나 전혀 학습하지 않은 새로운 영역에서도 인간 행동을 정확히 예측한다.

실제로 연구진은 훈련 데이터에 포함되지 않은 참가자와 실험 환경을 대상으로 테스트했을 때도, 센타우르가 기존 Llama 모델이나 전통적 인지 모델보다 높은 예측력을 보였다고 밝혔다.

센타우르는 메타(Meta)의 Llama 3.1 70B 언어모델을 기반으로, 파라미터 효율적 미세조정(QLoRA) 기법을 활용해 방대한 심리 실험 지식을 내재화했다. 이로써 AI가 인간의 정보처리 메커니즘(뇌 신경 패턴 등)과 자연스럽게 일치하는 내부 표현을 형성함이 밝혀졌다.