자연어 처리를 이용하여 알츠하이머를 예측하는 AI
IBM과 화이자(Pfizer)의 AI 연구팀은 사람들의 글을 분석하고 언어 패턴을 찾아 잠재적으로 알츠하이머병의 징후를 감지할 수 있는 AI 알고리즘을 개발하고 있다. 이 AI 모델은 임상 테스트에 앞서 의료진이 알츠하이머병의 발전 가능성에 대한 단서를 얻는 데 도움을 줄 수 있다. 기본적으로 의료진이 보다 광범위한 검사를 시작하도록 하는 조기 경보 시스템으로 볼 수 있다.
IBM-Pfizer 팀은 양전자 방사 단층 촬영(PET) 영상을 분석하거나 임상시험 데이터를 해석하여 알츠하이머 발병을 예측하는 모델을 개발했다. 이 모델은 60년 동안 3세대에 걸쳐 14,000명이 넘는 사람들에 대한 데이터를 포함하는 Framingham Heart Study 데이터로 학습되었다. AI가 장기간에 걸쳐 대규모 집단 내에서 패턴을 안정적으로 감지할 수 있는 것처럼 장기간의 데이터 확보는 잠재적으로 알츠하이머 증상을 예측할 수 있다. 또한 단층 촬영이나 침습 검사 없이 신뢰성 높은 진단을 가능하게 해줄 것이다.
AI 모델 학습을 위해 연구진은 다양한 질문에 대한 자필 응답서를 이용했다. Framingham Heart Study에서 시험 참가자들은 그림을 자연어로 기술하는 작업을 수행했다. 이 답 문장들은 디지털화되어 기계 학습 알고리즘에 학습 데이터로 입력된다. AI 모델은 신경 퇴행성 장애와 관련된 특정 언어적 특징을 포착할 수 있는 것으로 나타났다. 연구진은 반복되는 특정 단어, 맞춤법 오류 및 복잡한 문장에 대한 단순한 문구에 대한 선호 등이 알츠하이머병의 전조로 볼 수 있음을 발견했다.
AI 모델은 85세가 되기 전 알츠하이머병에 걸린 참가자를 예측하는 데 있어 약 70%의 정확도를 달성했다. 모델은 Framingham Heart Study의 과거 데이터에서 파생된 가장 오래된 데이터를 이용했다. 따라서 진정한 미래를 예측하는 것은 아니며, 비히스페닉 백인을 주로 하기 때문에 전 세계 인구를 대표할 수는 없다. 또한 표본 크기도 40명의 시험군과 40명의 대조군으로 작다는 한계가 있다.
그럼에도 이번 연구는 오랜 기간 동안 수집한 대규모 실생활 데이터를 분석한 첫 번째 시도로 가치를 갖는다. 또한 손글씨체와 같은 제외된 특성을 학습 데이터에 포함할 경우 정확도를 높일 수 있을 것으로 보인다. 이 외에도 녹음한 목소리를 통해 일시 정지와 같은 특성을 보완할 수도 있다. 이런 접근은 모두 비침습적 방법으로 참가자의 인지 능력을 측정할 수 있고 개인정보 보호와 같은 데이터 수집 상의 문제를 해결한다면 인터넷을 통해 저렴하게 원격으로 데이터를 모을 수 있는 장점이 있다.
음성 데이터를 자연어 처리를 통해 분석하면 알츠하이머뿐만 아니라 조현병, 근 위축성 측삭 경화증 및 파킨슨병 등을 더 잘 이해할 수 있을 것으로 예상된다.
관련연구자: Ajay Royyuru
관련기관: IBM
과학기술분류: 보건의료, 생명과학, 인지/감성과학
본문키워드(한글): 자연어 처리, 인공지능, 알츠하이머병, 음성 데이터
본문키워드(영문): NLP, AI, Alzheimer’s, speech data
원문언어: 영어
국가: 미국
원문출판일: 2020-11-02