review 0010-main.jpg



1. 들어가며


보건의료 빅데이터는 4차 산업혁명 시대의 핵심 자원으로 주목받고 있으며, 이에 대한 관심은 계속 높아지고 있다. 한의계 쪽에서도 의료 빅데이터를 활용한 분석 결과들이 점차 많아지고 있다. 이에 따라 한의계 연구자들이 이용할 수 있는 DB에 대해 알아보고 분석의 의의 및 한계와 향후 연구에 대해 논의를 해보고자 한다.


한의계 연구자들이 한의계 쪽 빅데이터를 활용하고자 하는 목적은 다양할 수 있다. 통제된 환경에서의 임상연구 RCT에서 나오는 근거뿐만 아니라 real world의 data 확인이 필요할 때 빅데이터를 분석할 수 있다. 또한 현실적으로 무작위배정비교임상연구 시행이 어려운 연구 가설을 검증한다던가 (예-임신 중인 환자를 대상으로 하는 연구), 일반적인 임상연구의 환자 수보다 대규모의 데이터가 필요하거나, 장기간의 추적관찰이 필요하다던가 등의 경우에 빅데이터 분석이 의미 있을 수 있다.


자생척추관절연구소에서 빅데이터 분석을 처음 시작하게 된 계기는 실용적 임상연구 설계 (Pragmatic clinical trial, PCT)을 위한 usual care를 정의하기 위함이었다. 실용적 임상연구를 수행하기 위한 연구계획 수립을 위해 한의약적인 중재와 usual care와 비교를 하는데 무엇을 usual care라고 할 것인지 설정에 어려움이 있었기 때문에 한국에서의 usual care는 무엇인가를 확인하기 위해 빅데이터 분석을 시작하였다. 빅데이터 분석을 통해 각 질환에서 한국에서 대표적으로 쓰는 치료를 확인하고 이를 참고하여 임상연구에서 usual care를 규정하였다. 이렇게 시작된 연구는 한국에서의 요추 질환 [1], 경추 질환 [2], 어깨 질환 [3], 무릎 질환 [4]에서의 어떤 치료가 주로 이루어지는지 논문으로 발표된 바 있다.


일반적으로 특정 질환에서의 대표적인 치료를 확인하기 위해서는 가이드라인을 확인하게 된다. 그러나 임상에서 복합치료를 주로 사용하나, 복합치료까지 언급되지 않은 가이드라인이 많고, 가이드라인별로 치료 방법의 권고가 다를 수 있기 때문에 한계가 있을 수 있다. 예를 들어 턱관절 장애의 경우 대표적 가이드라인이 없고, 몇 개의 가이드라인에서 다루고 있는 중재가 다양한 특성이 있었다. 턱관절장애에서의 usual care를 확인하기 위해 청구자료를 분석하였고, 가장 많이 사용하는 치료가 TMJ stimulation, 침이었으며, 약물 중에는 정신신경용제가 가장 많이 투여된 것이 확인되었다 [5]. 이렇듯 빅데이터 분석에서는 가이드라인과 다른 실제 임상에서의 처방 현황을 확인할 수 있으며, 근거와 임상현황 사이의 간극 (gap)을 확인할 수 있다.



2. 빅데이터 DB 소개


보건의료 분야에서 한의계의 연구자가 이용할 수 있는 빅데이터 DB, 한의사가 활용할 수 있는 빅데이터 DB는 건강보험심사평가원의 보건의료빅데이터개방시스템, 국민건강보험공단의 National Health Insurance Sharing Service (NHISS), 국민건강영양조사, 중앙암등록본부에서 제공하는 암 등록 자료 등이다. 이중 가장 많이 활용하는 것은 건강보험심사평가원과 국민건강보험공단의 자료이다.


1) 건강보험심사평가원의 보건의료빅데이터개방시스템


건강보험심사평가원은 보건의료빅데이터개방시스템 (https://opendata.hira.or.kr/) 홈페이지를 통해 빅데이터 관련 정보를 제공하고 있다. 공공데이터, 의료빅데이터, 의료통계정보 등이며 공공데이터에서는 환자표본자료를 의료빅데이터에서는 맞춤형 자료를 제공하고 있다. 공공데이터에서는 간단한 요양기관 및 진료 정보 등을 제공하고 있을 뿐만 아니라 환자표본자료를 아래 네 가지 형태로 제공하고 있다.


① 입원환자데이터셋 (2009-2016년 입원환자 추출 비율 13%, 약 100만 명, 2017~ 입원환자 추출 비율 10%, 약 75만 명)


② 전체환자데이터셋 (2009-2016년 전체환자 추출 비율 3%, 약 140만 명, 2017~전체환자 추출 비율 3%, 약 145만 명)


③ 고령환자데이터셋 (2009-2016 고령환자 (만 65세 이상) 추출 비율 20%, 약 100만 명, 2017~고령환자 추출 비율 10%, 약 70만 명)


④ 소아청소년환자데이터셋 (2009-2016 소아청소년환자 (약20세 미만) 추출 비율 10%, 약 110만 명, 2017~소아청소년환자 추출 비율 10%, 약 100만 명)


수수료 납부 시 데이터가 이동형 저장매체로 제공되어 원격접속을 하지 않고 이용할 수 있는 장점이 있다. 그러나 매해 추출되는 데이터셋이기 때문에 장기간에 걸친 경과를 관찰할 수 없는 단점이 있다. 전체 환자 데이터셋도 140만 명 정도이기 때문에 발병이 많지 않은 질환이나, 이용량이 많지 않은 의료 중재 등을 분석해야 하는 경우에는 어려움이 있다. 또한, 법정전염병 및 희귀질환은 전부 마스킹이 되어있는데 하위상병에 희귀질환 및 전염병이 포함되어 있으면 3단코드 전체가 마스킹이 되어있다. 예를 들어 안면마비 상병인 G51.0도 하위에 포함된 희귀질환으로 인해 G51 전체가 마스킹 되어 있기 때문에 분석하려는 상병이 데이터셋에서 분석 가능한지 미리 확인할 필요가 있다. 또한, 우울증이나 치매 등 F로 시작하는 상병의 경우에는 마스킹으로 인해 분석에 어려움이 있을 수 있다.


맞춤형 자료의 경우에는 2007년 1월 자료부터 활용이 가능하며, 요양급여비용 청구자료를 연구목적에 맞추어 맞춤형으로 가공하여 제공하고 있다. 신청접수를 하면 공공데이터 제공 심의위원회에서 제공 여부를 결정하게 되고 승인이 나면 원격분석시스템을 통해 분석이 가능하다. 과제별로 1개의 원격계정을 제공하며 원격분석시스템을 통해 분석을 진행하게 된다.


자생 척추관절연구소에서는 심평원의 환자 표본 자료 분석을 환자의 주요 의료 이용 현황 혹은 의료 현황 추이 변화 등을 살펴보는 논문에 이용하고 있으며, 경제성평가 분석에서 필요한 비용 자료 확보 등을 위해 활용하고 있다. 앞서 언급한 바와 같이 심사평가원의 환자 표본 자료는 매해 추출되는 데이터셋이기 때문에 환자의 연속적인 의료이용이나 의료이용에 따른 결과를 파악하기 어렵다.


2) 국민건강보험공단의 건강보험자료 공유서비스


국민건강보험공단 NHISS (https://nhiss.nhis.or.kr/)에서는 표본코호트 DB와 맞춤형 DB 두 종류의 형태로 자료를 제공하고 있다. 표본코호트 DB에서는 총 6가지의 코호트 DB를 제공하고 있는데, 표본코호트 DB, 건강검진코호트 DB, 노인코호트 DB, 직장여성코호트 DB, 영유아검진코호트 DB, 당뇨형코호트 DB이다. 국민건강보험공단의 표본코호트 DB에서는 심사평가원의 DB와 달리 통계청 사망원인 DB와 연계된 데이터가 포함되어 있기 때문에 표본 대상자의 출생연도, 사망 연월 및 사망원인 등을 확인할 수 있는 장점이 있다. 또한 모든 환자는 아니지만, 건강검진 테이블이 포함되어 있기 때문에 이를 포함한 분석 계획 수립이 가능할 수 있다.


① 표본코호트 DB: 전 국민 모집단의 2%, 성, 연령, 가입자 구분, 보험료 분위, 지역별 층화추출한 100만 명의 2002~2015년 (14년) 자료


② 건강검진코호트 DB: 약 51만 명의 건강검진 및 2002-2015년 (14개년) 자료


③ 노인코호트 DB: 2002년 자격 유지자 중 만 60세 이상의 약 55만 명의 2002-2015 (14개년) 자료


④ 직장여성코호트 DB: 2007년 자격 유지자 중 15-64세 직장여성 약 18만 명


⑤ 영유아검진코호트 DB: 영유아 검진 1~2차를 1회 이상 받은 전체 수검자 중 2008-2012년 출생자를 추출하여 출생연도별 5% 표본추출


⑥ 당뇨병코호트 DB: 당뇨병 환자군 40만 명과 대조군 40만 명 1:1 매칭 구성


코호트 DB에서도 민감상병들이 마스킹 되어 있는데 전염 및 희귀질환을 마스킹하고 있는 건강보험심사평가원과 약간의 차이가 있다. 민감상병으로 신경정신과 질환, 일부 부인과 질환, 전염성 질환 등 상당히 많은 상병을 마스킹하고 있으며, 분만 및 민감 관련 수가코드 또한 마스킹 처리하고 있기 때문에 분석할 질환이 마스킹 대상이 아닌지 사전 검토가 필요하다. 마스킹 대상 상병을 분석하고자 하는 경우에는 맞춤형 DB 신청이 필요하다. 표본코호트 DB는 원격으로 이용이 가능하며, 공단의 맞춤형 DB는 공단 내의 장소인 빅데이터 분석센터에서 분석이 가능하다.


국민건강공단의 코호트 DB는 100만 명의 2002년부터 2015년까지의 연속적인 의료 이용 자료가 있기 때문에 인과 관계 등을 확인할 수 있는 장점이 있다. 자생척추관절연구소에서는 이를 활용해서 급성 요통 환자에서 침을 맞은 환자와 침을 맞지 않은 환자로 나누어 수술률을 비교하는 분석을 시행하여 급성 요통에서 침이 수술률을 낮추는 효과가 있음을 분석한 바 있다 [6].



3. 빅데이터 분석 연구의 의의


특정 치료의 유효성과 안전성을 확인하는 가장 대표적인 방법은 무작위배정임상연구를 시행하는 것이다. 그러나 무작위배정임상연구는 연구 주제에 따라 많은 비용이 들 수 있고, 환자 모집에 어려움이 있을 수 있으며, 장기 추적관찰을 요하는 주제의 경우에는 비용, 시간, 인력 등의 연구 진행에 매우 많은 어려움이 발생할 수 있다. 또한 확신의 정도가 높은 결론을 도출하기 위해서는 많은 수의 환자를 대상으로 해야 하나, 현실적으로 쉬운 일은 아니다. 또한 의료기관 데이터를 활용하여 분석하더라도 다른 기관에서의 의료이용 정보를 파악할 수 없으며, 환자의 추적관찰을 실패하는 경우가 발생할 수 있다.


한국에서 현재 가장 대표적으로 이용할 수 있는 심평원 및 건강보험공단 자료 같은 경우는 한국의 건강보험 청구자료를 기반으로 구축된 자료로 파악할 수 있는 의료 정보가 장기간에 거친 의료이용, 발병자료뿐만 아니라 비용 정보가 포함되어 있다는 점에서 의미가 있다.



4. 한의계의 빅데이터 분석 연구 실제 예


여기서는 자생척추관절연구소뿐만 아니라 한의계의 연구자들이 발표한 빅데이터 분석 논문들을 소개하고자 한다. 여기서 소개한 논문 외에도 많은 한의계 연구자들이 빅데이터를 활용한 좋은 연구를 발표하고 있다.


1) 한의 치료가 허혈성 뇌졸중 환자에 미치는 영향 [7]


공단 표본코호트를 이용한 분석으로 허혈성 뇌졸중 환자에서 한의 치료와 비한의 치료군을 비교하였다. 한의 치료군이 좀 더 생존 가능성이 높은 것으로 나타났으며, 재입원율에는 차이가 없었다.


2) 임신 중 침 안전성 분석 [8]


공단 표본코호트 (ver. 1.0)을 이용한 분석으로 임신 중 침 치료를 받은 여성과 임신중 침 치료를 받지 않은 여성에서의 출산 결과 (사산, 조산)의 차이가 있는지를 분석하여 임신 중 침의 안전성에 대한 정보를 확인하고자 하였다. 침 치료를 받은 군과 받지 않은 군에서 사산이나 조산의 발생에 유의한 차이가 없어 임신 중 침 치료가 임산부에게 안전한 치료로 제시될 수 있음을 확인하였다.


3) 급성 요통 환자의 침 치료가 수술에 미치는 효과 분석 [6]


공단 표본코호트 (ver 1.0)를 이용한 분석으로 급성 요통으로 침을 맞은 환자와 침을 맞지 않은 환자에서의 수술률에 차이가 있는지를 분석하였다. 침을 맞은 그룹에서 유의하게 수술률이 낮은 것을 확인할 수 있었으며, 이 외에도 경항통에서 침 치료 여부에 따른 수술률 차이 [9], 어깨 질환에서의 침 치료 여부에 따른 수술률 차이 [10], 무릎 질환에서 침 치료 여부에 따른 수술률 차이 [11] 등으로 분석 결과가 발표된 바 있다.



5. 빅데이터 분석 연구의 한계


한의약 관련 빅데이터 분석 연구의 한계는 두 가지로 나누어 볼 수 있다. 한 가지는 일반적인 청구자료 분석의 한계로 청구자료에서 확보할 수 있는 자료가 한정적이라는 점이다. 예를 들어 A라는 치료와 B라는 다른 치료의 효과를 비교하려고 할 때 두 치료를 받은 환자군이 동질 하며, 중증도가 유사하다는 전제가 있어야 비교가 가능할 것이다. 안면마비 환자를 예로 들어 생각했을 때 건강보험청구자료에서는 안면마비의 중증도를 확인할 방법이 없다는 한계가 있다. 분석한 비교 대상이 실제로 동등했느냐를 입증하는 것에 한계가 있기 때문이다. 질환에 따라서 baseline 시점에 사용한 약물이나 검사 등으로 조작적 정의 등을 시도할 수는 있겠으나 한계가 있을 수 있다.


또한 안면마비의 치료 경과 또한 건강보험 청구자료에서는 파악이 어렵다는 한계가 있다. 청구자료에서 확인할 수 있는 결과는 질환의 발생 여부나, 수술 여부, 입원 여부, 사망 여부, 약물 이용 변화 등의 의료이용 변화 등이기 때문에 이러한 결과 분석은 가능하나, 안면마비 같은 질환이 어느 정도 회복되었는지, 증상이 어떻게 변화하였는지 확인이 어렵다. 안면마비로 인한 치료가 중단되면 ‘회복’이라는 조작적 정의를 하기도 하지만, 실제로 회복인지 확신할 수는 없다.


두 번째 제한점은 건강보험에 등재된 한의 치료기술이 침, 부항, 전침, 보험용 한약제제, 추나 (2019년 4월~) 등으로 한정적이라는 점이며 비급여 치료의 시행 여부를 확인할 수 없다는 점이다. 한방의료기관의 한의사들은 환자들에게 일반적으로는 단일 치료보다 복합 치료를 많이 사용하고 있다. 따라서 환자 치료 시에 건강보험 등재 치료와 비급여 치료가 함께 사용되고 있는 경우가 많다. 청구자료에서 ‘침’ 청구명세서만 확인되었다고 해서 이 환자가 침만 치료받았다는 확신을 할 수 없다. 따라서 침 또는 부항의 단독 치료 효과를 청구자료에서 분석하기는 어렵다.


또한 건강보험 청구 제한으로 인해 청구자료에는 확인되지 않으나 실제로는 시행되었을 치료들이 있을 수 있어 현실을 생각한다면 청구자료에서 침 치료만 확인된 환자라도 침 치료를 받은 환자보다는 한방의료이용 환자로 분석을 하는 것이 더 현실을 반영한 분석일 수 있다. 따라서 특정 치료의 효과보다는 ‘한방의료이용’이 미치는 효과로 분석해야 하므로 대상 질환/중재/비교/결과변수 중 중재 (치료방법)가 고정적이다. 대상 질환이나 비교, 결과변수 등에서만 변화를 주어 분석이 가능하다. 향후 더 많은 한의 치료기술들이 급여화된다면 좀 더 다양한 분석을 기대할 수 있으며, 이를 통해 한의 치료기술에 대한 유효성 근거를 확보할 수 있을 것으로 기대한다.



6. 향후 연구


향후 한의계의 많은 연구자들이 빅데이터를 활용한 분석을 통해 다양한 질환에서의 한의약 치료의 효과들이 입증되어 나가기를 기대한다. 그러나 앞서 말한 한계로 인해 다양한 한의 치료기술들의 효과를 규명하기 어렵다는 단점이 있었다. 이에 대한 해결 방법으로는 의료기관에서의 자료와 건강보험심사평가원 또는 국민건강보험공단의 자료 연계를 고려해볼 수 있다. 그동안 개인정보보호법 시행으로 인해 의료기관의 자료와 청구자료를 연계할 방법이 없었다.


그러나 지난 2020년 8월 개인정보 보호법이 개정되어 개인정보를 가명 처리하여 통계작성, 과학적 연구, 공익적 기록보존 등의 목적으로 활용할 수 있는 기반이 마련되었다 [12]. 즉, 의료기관의 자료와 국민건강보험공단이나 건강보험심사평가원의 청구자료를 연계할 방법이 생긴 것이다. 이러한 결합을 통해 그동안 의료기관 자료 조사만으로는 확인이 어려웠던 결과에 대한 확인을 기대할 수 있으며, 위에서 살펴보았던 빅데이터 분석에서의 한계를 극복할 수 있을 것이다. 향후 의료기관과 건강보험공단의 자료를 연계한 활발한 자료 분석과 이를 통한 근거가 많아짐을 기대해본다.



References


[1] Ahn YJ, Shin JS, Lee J, Lee YJ, Kim MR, Park KB, Lee JH, Shin KM, Ha IH. Evaluation of use and cost of medical care of common lumbar disorders in Korea: cross-sectional study of Korean Health Insurance Review and Assessment Service National Patient Sample data. BMJ open. 2016 Sep 12;6(9):e012432. doi: 10.1136/bmjopen-2016-012432.


[2] Choi AR, Shin JS, Lee J, Lee YJ, Kim MR, Oh MS, Lee EJ, Kim S, Kim M, Ha IH. Current practice and usual care of major cervical disorders in Korea: a cross-sectional study of Korean health insurance review and assessment service national patient sample data. Medicine. 2017 Nov;96(46):e8751. doi: 10.1097/MD.0000000000008751.


[3] Joo H, Lee YJ, Shin JS, Lee J, Kim MR, Koh W, Park Y, Song YK, Cho JH, Ha IH. Medical service use and usual care of common shoulder disorders in Korea: a cross-sectional study using the Health Insurance Review and Assessment Service National Patient Sample. BMJ open. 2017 Jul 12;7(7):e015848. doi: 10.1136/bmjopen-2017-015848.


[4] Suh CY, Lee YJ, Shin JS, Lee J, Kim MR, Koh W, Cha YY, Shin BC, Hwang EH, Suhr K, Kim M. Analysis of medical service use of knee osteoarthritis and knee meniscal and ligament injuries in Korea: a cross-sectional study of national patient sample data. BMC Musculoskelet Disord. 2017 Nov 10;18(1):438. doi: 10.1186/s12891-017-1795-7.


[5] Seo H, Jung B, Yeo J, Kim KW, Cho JH, Lee YJ, Ha IH. Healthcare utilisation and costs for temporomandibular disorders: a descriptive, cross-sectional study. BMJ open. 2020 Oct 28;10(10):e036768. doi: 10.1136/bmjopen-2020-036768.


[6] Koh W, Kang K, Lee YJ, Kim MR, Shin JS, Lee J, Lee JH, Shin KM, Ha IH. Impact of acupuncture treatment on the lumbar surgery rate for low back pain in Korea: A nationwide matched retrospective cohort study. PloS one. 2018 Jun 12;13(6):e0199042. doi: 10.1371/journal.pone.0199042. eCollection 2018.


[7] Lee YS, Kwon S, Chae Y, Jang BH, Ko SG. A retrospective cohort study on the outcomes of ischemic stroke patients with adjuvant Korean Medicine treatment. Scientific reports. 2018 Jan 26;8(1):1656. doi: 10.1038/s41598-018-19841-w.


[8] Moon HY, Kim MR, Hwang DS, Jang JB, Lee J, Shin JS, Ha I, Lee YJ. Safety of acupuncture during pregnancy: a retrospective cohort study in Korea. BJOG: An International Journal of Obstetrics & Gynaecology. 2020 Jan;127(1):79-86. doi: 10.1111/1471-0528.15925.


[9] Han DG, Koh W, Shin JS, Lee J, Lee YJ, Kim MR, Kang K, Shin BC, Cho JH, Kim NK, Ha IH. Cervical surgery rate in neck pain patients with and without acupuncture treatment: a retrospective cohort study. Acupuncture in Medicine. 2019 Oct;37(5):268-76. doi: 10.1136/acupmed-2018-011724.


[10] Yang G, Jung B, Kim MR, Koh W, Kim N, Lee EK, Ha IH. Acromioplasty rates in patients with shoulder disorders with and without acupuncture treatment: a retrospective propensity score–matched cohort study. Acupuncture in Medicine. 2020 Aug;38(4):255-63. doi: 10.1177/0964528419895529.


[11] Gang BG, Shin JS, Lee J, Lee YJ, Cho HW, Kim MR, Kang K, Koh W, Kim EJ, Park Y, Nam D. Association Between Acupuncture and Knee Surgery for Osteoarthritis: A Korean, Nationwide, Matched, Retrospective Cohort Study. Frontiers in Medicine. 2020 Sep 16;7:524628. doi: 10.3389/fmed.2020.524628.


[12] 개인정보보호위원회, 보건복지부. 보건의료 데이터 활용 가이드라인. 2020



© KMCRIC 한의약 과학 한마당