
[뉴스스페이스=윤슬 기자] AI가 이제 인간의 선택까지 밝혀낼 전망이다.
독일 헬름홀츠 뮌헨 연구진이 개발한 인공지능(AI) 모델 ‘센타우르(Centaur)’가 전 세계 인지과학계와 AI 업계의 이목을 집중시키고 있다고 Nature, Science, TechXplore의 매체들이 연이어 보도했다.
센타우르는 160종 심리학 실험에서 6만92명의 참가자가 남긴 1068만건 이상의 선택 데이터를 학습해 인간의 의사결정과 행동을 전례 없는 정확도로 예측하는 능력을 보여준다. 이 모델은 기존 심리학 이론이나 통계 모델을 뛰어넘어, 완전히 새로운 상황에서도 인간의 선택을 예측할 수 있다는 점에서 ‘가상 실험실’로 불린다.
'Psych-101' 세계 최대 규모의 심리 실험 데이터셋
센타우르의 기반이 된 ‘Psych-101’ 데이터셋은 자연어로 전사된 160개 심리 실험의 데이터로, 각 실험의 텍스트, 실험 고유 식별자, 참가자 식별자 등 표준화된 구조를 갖춘다. 데이터셋 내 인간의 응답은 “>” 토큰으로 표시되어, AI 모델이 쉽게 학습할 수 있도록 설계됐다.
이 방대한 데이터는 실제로 1060만건이 넘는 인간의 선택을 포함하며, 이는 기존 인지과학 연구에서 찾아보기 힘든 규모다.
연구팀은 여기서 그치지 않고, 약 100만명의 참가자와 1억건의 선택 데이터를 목표로 하는 ‘Psych-201’ 프로젝트를 추진 중이다. 이 확장 프로젝트가 완성되면, 심리학적 맥락의 다양성과 인지모델의 정밀도가 한층 강화될 전망이다.
완전히 새로운 상황에서도 ‘인간처럼’
센타우르가 기존 모델과 가장 크게 차별화되는 지점은 ‘일반화 능력’이다. 기존 심리학 모델들은 특정 영역(예: 도박, 기억 게임 등)에서만 뛰어난 성과를 보였지만, 센타우르는 문제 구조가 바뀌거나 전혀 학습하지 않은 새로운 영역에서도 인간 행동을 정확히 예측한다.
실제로 연구진은 훈련 데이터에 포함되지 않은 참가자와 실험 환경을 대상으로 테스트했을 때도, 센타우르가 기존 Llama 모델이나 전통적 인지 모델보다 높은 예측력을 보였다고 밝혔다.
센타우르는 메타(Meta)의 Llama 3.1 70B 언어모델을 기반으로, 파라미터 효율적 미세조정(QLoRA) 기법을 활용해 방대한 심리 실험 지식을 내재화했다. 이로써 AI가 인간의 정보처리 메커니즘(뇌 신경 패턴 등)과 자연스럽게 일치하는 내부 표현을 형성함이 밝혀졌다.

반응 시간까지 예측하는 AI
센타우르는 단순히 ‘무엇을 선택할 것인가’만 예측하는 것이 아니다. 약 400만건의 반응 시간 데이터를 분석한 결과, 센타우르의 반응 엔트로피(불확실성 지표)가 인간 반응 시간 분산의 58%(조건부 R²=0.58)를 설명하는 것으로 나타났다.
이는 기존 Llama 모델(0.4)이나 전통적 인지 모델(0.38)보다 월등히 높은 수치다. 이 결과는 선택지 수가 늘어날수록 반응 시간이 길어진다는 ‘힉의 법칙(Hick’s Law)’과도 일치한다.
다만, 일부 비평가들은 센타우르가 프롬프트에 따라 1밀리초와 같은 ‘초인간적’ 반응 시간을 산출할 수 있다는 점을 지적하며, ‘인간 인지의 시뮬레이션’과 ‘실제 복제’의 차이를 강조했다.
임상 심리학·정신건강 연구의 새 지평
센타우르는 임상 심리학, 정신건강, 행동경제, 마케팅 등 다양한 분야에서 응용 가능성이 높다. 특히 우울증, 불안장애 등 심리적 상태가 의사결정 과정에 미치는 영향을 가상 실험실에서 정밀하게 분석할 수 있다는 점이 주목받는다.
연구팀은 향후 Psych-101·201 데이터셋에 인구통계·심리 특성 데이터를 추가해, 성별·연령·문화권 등 다양한 변수까지 반영할 계획이다.
전문가 평가 및 전망
네이처(Nature), 사이언스(Science), StudyFinds 등 주요 해외 매체들은 “센타우르는 인지과학의 패러다임을 바꿀 잠재력이 있다”, “단일 모델이 다양한 심리 실험을 아우르는 것은 사상 최초”라며 극찬했다.
연구팀은 “센타우르는 해석 가능한 이론과 예측력 사이의 오랜 간극을 메우는 도구”라며, “향후 가상 실험실을 통한 인간 행동 연구의 혁신이 기대된다”고 밝혔다.