![HBB유전자의 변이(왼쪽)인 베타-글로빈 단백질은 헤모글로빈의 하위 구조의 하나로 겸상적혈구빈혈을 일으킬 수 있다. 이온 채널에 작용하는 CFTR 단백질의 변이(오른쪽)는 낭포성 섬유증을 일으킬 수 있다. [구글 딥마인드] HBB유전자의 변이(왼쪽)인 베타-글로빈 단백질은 헤모글로빈의 하위 구조의 하나로 겸상적혈구빈혈을 일으킬 수 있다. 이온 채널에 작용하는 CFTR 단백질의 변이(오른쪽)는 낭포성 섬유증을 일으킬 수 있다. [구글 딥마인드]](/data/photos/202309/1213_1225_506.jpg)
[뉴스스페이스=이은주 기자] 구글의 인공지능 자회사 딥마인드가 수백만 개 유전자 변이를 분석해 어떤 변이가 질병을 일으킬 가능성이 있는지 예측하는 인공지능(AI)을 개발했다.
이번 연구로 유전자 변이로 인한 희소질환 진단과 예측에 속도가 붙을 전망이다. 인간에게 질병을 일으킬 수 있는 유전자 변이가 너무 많은 것은 의학계의 큰 난제였다. 이를 해결하는데 인공지능이 큰 역할을 하고 있다.
구글 딥마인드는 유전자 변이가 질병 유발에 미치는 영향을 분석할 수 있는 AI ‘알파 미스센스’를 개발했다고 19일(현지 시각) 국제 학술지 사이언스에 밝혔다.
또 딥마인드 테크놀로지스가 인간에게 질병을 일으킬 수 있는 단백질 구조의 유전자 변이 7100만 가지를 선정했다고 미 월스트리트저널(WSJ)이 19일(현지시간) 보도했다.
인간 유전자(DNA)는 A(아데닌), G(구아닌), C(시토신), T(티민) 4가지 염기가 두 개씩 결합해 배열된 구조를 갖고 있다. DNA 염기 배열 순서에 따라 우리 몸을 구성하는 단백질이 만들어진다. 하지만 배열된 염기 중 한 가지가 빠지거나 순서가 바뀌는 ‘미스센스(missense) 변이’가 발생할 수 있다.
인간의 몸에는 평균 9000개 정도의 미스센스 변이가 존재한다. 대부분 인체에 영향을 미치지 않지만, 일부는 단백질 작용을 방해해 낭포성 섬유증과 겸상 적혈구 빈혈, 암, 뇌 발달 문제 등을 일으킨다.
딥마인드사는 인공지능 모델 알파미스센스(AlphaMissense)를 이용해 단백질의 구조 변이를 평가해 질병을 일으킬 가능성을 예측했다. 이 인공지능은 단일 아미노산에 의해 단백질 구성이 바뀌는 '미스센스' 돌연변이를 찾아낸다.
알파미스센스는 인간 단백질 1만9000여 가지가 일으킬 수 있는 2억1600만 가지의 단일 아미노산 변이 가능성을 모두 검토해 7100만 개의 미스센스 변이를 예측하고 생물학적 데이터의 패턴을 토대로 변이가 질병을 일으킬 확률을 계산했다. 그 결과 각 변이의 32%가 질병을 일으킬 수 있고 57%는 무해한 것으로 평가했다.
구글 딥마인드 연구팀은 "지금까지는 미스센스 변이 중 0.1% 정도만 질병 유발 가능성 여부를 판단할 수 있었는데, 알파 미스센스는 이 비율을 89%까지 높였다"고 강조했다. 이어 "지금까지 알지 못했던 수많은 질병의 원인을 알아낼 수 있을 것"이라며 "희귀 질환으로 고통 받는 환자들을 위한 치료법 개발로 이어지길 바란다"고 설명했다.
구글 딥마인드는 앞서 2020년에도 신약 개발과 화합물 생성에 활용할 수 있는 단백질 구조 예측용 AI '알파 폴드2'를 공개한 바 있다.