몇달전 서울아산병원에서 열린 <헬스이노베이션 빅데이터센터 개소 컨퍼런스> 다녀왔는데 한의계/약학계에 계신 연구자 여러분께도 도움이 될 것 같아 두서없지만 필기한 것 몇자 적어봅니다.    

--------------------------------------------------

앞으로 임상데이터를 많이 모으고 서로의 상관 관계(인과 관계)를 밝혀 임상데이터(clinical data)의 대부분이 분자데이터(molecular data) 영역과 겹쳐지는 시대가 되면 질환을 정복할 수 있는 시대가 올 수 있을 것이다.

기존에는 제약업계에 '10억불 들여서 10년 동안 연구하면 그 동안 10%를 신약으로 만든다'는 얘기가 통용됐지만, 빅데이터를 활용한 정밀의료 시대에는 각각의 질환 세포에 맞는 부티크식의 약 생산(개인화된 제약 산업)이 일반화될 것이다.

건강보험공단은 'My Health bank'를 통해 본인의 건강검진 결과 자료를 내려 받을 수 있는 서비스를 제공할 계획이며 앞으로 이러한 검진 결과를 토대로 분석을 제공하는 기업의 서비스를 연계해 이용할 수 있을 것이다.

축적되지만 활용하지 못하고 있는 데이터가 75%에 이르는데 이 데이터에 대한 분석과 통찰이 이우러진다면 유용할 것이다. '인공지능' 대신 '인지컴퓨팅(Cognitive Computing)'이라는 용어를 사용.

지난 해 말 임상용 고해상 모니터를 출시하고 올해는 X-ray 디텍터를 개발한다는 LG전자는 인공지능(AI) 및 사물인터넷(IoT) 기술을 활용해 의료 음성인식과 의료 병변인식, 생체신호 인식 기술 개발 및 맞춤형 뷰티서비스 등의 사업을 추진함.


병원 간 데이터 공유를 통한 의료 빅데이터 분석 및 활용에 있어, 다학제 및 산학연 협력체로 임상자료를 시각화하는 오픈 소스 툴을 제공하며 14개국가에서 6억 6천 명의 자료를 모은 OHDSI(Observational Health Data Sciences and Informatics)를 소개하며 공통자료모델(CDM) 구축에 대해 설명했다.

다기관 연구 수행을 지원하는 데이터 모델인 CDM을 통해 자료 공유 없이 코드 공유만으로 자료 분석을 수행할 수 있다.

하지만 컨텐츠 수용력이나 익명화되지 않은 대규모 임상자료의 활용, 표준용어 매핑 등에 있어서의 한계와 CDM 변환으로 인한 자료 손실 발생이 있음. 

메타데이터화, 유전체 빅데이터 연계 플랫폼 구축, 임상자료 비식별화 수행, 표준용어, 국내 및 병원내 코드 동시 적재 등의 CDM 모델의 개선이 필요함.

유전체 연구에 있어서 적용되는 생명윤리법 내 인체유래물 연구 및 기증 동의서 제도와 관련해서 연구에 대한 동의를 받았음에도 불구하고 식별자가 제거된 상태에서 연구자에게 분양돼 개별 연구자의 정밀의료 연구에 여전히 한계가 있다. 

또한, 통계 및 연구 목적으로 특정 개인을 알아볼 수 없는 형태로 개인정보를 제공하는 경우 정보주체의 동의 없이 데이터 활용, 제공이 가능토록 한 '개인정보보호법'과  연구대상자로부터 서면 동의를 받은 경우에만 기관위원회(IRB) 승인을 거쳐 제공할 수 있도록 한 '생명윤리법'이 충돌하고 있음. 이에 대해 일본의 개인정보법 개정과 유럽(EU)의 GDPR 개정 사례를 통해 데이터의 합법적 활용 가능 범위 확대가 필요함을 주장.