코로나19의 수학적 분석: 수리모델, 방역정책 수립의 근거가 되다



이효정 국가수리과학연구소 부산의료수학센터 센터장·권예슬 기초과학연구원(IBS) 커뮤니케이션팀 선임행정원



데이터 분석과 시뮬레이션으로 예측하는 코로나19 확산


신종 바이러스의 위협은 인류에게 이제 익숙한 일이 되었다. 최근 우리나라는 사스(SARS‧중증급성호흡기증후군), 메르스(MERS‧중동호흡기증후군), 그리고 2020년 발생한 코로나19의 타격까지 받으며 여러 차례 경제적‧사회적 어려움을 겪었다.


미지의 바이러스가 나타나면 과학자들은 그 구조와 실체를 분석한다. 바이러스 유전정보 규명이 대표적인 예다. 이를 토대로 제약회사들은 바이러스에 대처할 백신과 치료제를 개발한다. 이렇게 바이러스를 제압할 무기를 만드는 동안, 방역은 국민을 보호하고 피해를 최소화하는 방어막 역할을 한다. 방역에는 정확한 피해 예측 기술도 동반되어야 한다. 그래야 의료진 배치, 필요 병상 확보 등의 대책을 세울 수 있기 때문이다.


수학은 이와 같은 방어막 구축에 과학적 근거를 제공한다. 감염 데이터 분석과 감염병 발생 예측 시뮬레이션을 통해 효과적인 방역정책 수립에 기여할 수 있다. 해외 주요국가 역시 수리모델을 코로나19 감염병 확산 차단 및 대응 전략 수립에 활용하고 있다. 미국 질병통제예방센터(CDC)의 ‘COVID-19 Surge’, 세계보건기구(WHO)의 ‘CovidSIM’등이 대표적이다.


vol.16_1.jpg

▲ 세계보건기구(WHO)의 감염병 수리모델인 ‘코비드심(CovidSIM).’ 영국 임페리얼칼리지런던 연구팀이 개발했다. (출처: 세계보건기구 홈페이지)


감염병 수리모델의 역사


수리모델은 현실의 문제를 수학적으로 바꿔 풀고, 다시 현실에 적용하여 문제를 해결하는 도구다. 네덜란드 수학자 다니엘 베르누이가 천연두의 확산을 막기 위해 처음으로 수학을 사용한 것이 시초가 됐다. 1927년에는 영국의 수학자 커맥과 맥캔드릭이 제안한 질병구획(compartment) 중심의 ‘SIR 모델’이 개발됐다. SIR 모델은 전체 인구를 감염 가능성이 있는 사람(S‧Susceptible), 감염된 사람(I‧Infected), 질병에서 회복 또는 사망하여 감염 위험에서 벗어난 집단(R‧Recovered) 등 세 개로 나눠 감염 유행을 예측한다. 각 개인은 세 구획 중 한 곳에 속해 S→I→R 순서로 이동하는 개념적으로 단순한 모델이다. 이는 질병확산 모델의 모체가 되어 지금까지도 다양하게 활용되고 있다.


전통적인 감염병 예측 모델은 주로 감염자와의 접촉을 통한 감염 자체에 초점을 뒀다. 기존 SIR 모델은 감염자에게 노출된 집단(E‧Exposed)을 반영하여 감염자 수의 증감을 추정하는 ‘SEIR 모델’로 발전했다. 이후 전염병 확산을 막기 위한 치료와 격리 등 행동 변화를 고려한 ‘SEIQR’, ‘SEIHR’ 모델 연구도 활발하게 이뤄지고 있다.


많은 연구들은 전염병 확산 과정이 결정적으로 움직인다고 가정하고, 상미분 방정식(ODE‧Ordinary Differential Equation)을 이용하여 모델을 개발한다. 반면, 전염병이 확률적으로 확산한다고 가정하여 예측 모델을 개발하는 연구도 진행되고 있다 [Choi et al., 2012].


vol.16_2.jpg

▲ 전통적인 감염병 예측 수리모델의 구조. 전통적인 수리모델은 주로 감염자와의 접촉을 통한 감염 자체에 초점을 두고 있다.


수리모델의 해답, 재생산지수


요컨대 감염병 예측 수리모델은 감염병 발생 시 감염자 수, 접촉자, 회복 집단 등 각 변수 상황에 적절한 수를 대입해서 감염 인구를 예측하는 방정식이다. 그렇다면 수리모델이 구하는 해답은 무엇일까. 바로 요즘 뉴스에서 흔히 접할 수 있는 재생산지수(R값)다.


기초감염재생산수(R0)는 감염이 없는 집단에서 발생한 첫 감염자가 평균적으로 감염시킬 수 있는 환자 수를 나타낸다. R0이 1보다 크면 환자 수가 증가하여 감염병이 유행(epidemic)할 가능성이 있다. 반대로, R0이 1보다 작으면 이 질병은 집단에서 서서히 소멸된다.


하지만 코로나19처럼 팬데믹이 장기화되는 상황에서는 다른 접근이 필요하다. 즉 R0 보다는 실질감염재생산수(Effective reproduction number, Rt)를 고려해야 한다. Rt는 일부 면역이 있는 집단이나 방제가 이뤄지는 상황에서, 시간별로 발행한 감염자로 인해 평균적으로 감염되는 환자 수를 나타낸다. Rt는 확산 여부를 판단하는 실질적 지표로, 방역당국의 완화전략 효과의 평가에 활용될 수 있다. 달리 말하면 Rt를 1 이하로 만들기 위한 방역대책 수립이 필요한 것이다.


한국형 코로나19 감염 확산 예측 수리모델 개발


국내 첫 코로나19 확진자는 2020년 1월 20일에 발생했다. 당시 전개된 몇 가지 굵직한 사건들은 다음과 같다. 2월 중순 대구‧경북 지역 신천지 발 코로나19 대유행, 5월 중순 이태원 클럽 발 전국적 감염 확산, 8월 수도권 교회 및 서울 도심 집회에서 촉발된 대유행 등이다. 이 사건들을 국내 연구진의 코로나19 수리모델 연구 결과와 비교하며 살펴보자.


국방과학연구소 연구진은 2020년 1월 20일부터 7월 31일까지의 기간을 5일 간격으로 나눠 코로나19 Rt값을 구했다 [Jung et al., 2020]. 그 결과, 2월 15일에 Rt값이 6.6, 5월 중순에 Rt값이 2 이상으로 나타났다. 각각 신천지 및 이태원 클럽발 대유행이 발생했던 시점에 해당한다. 한편, 숭실대 연구진은 코로나19 확진자 발생 사례가 가장 많았던 서울‧경기 및 대구‧경북 지역에 대해 Rt값과 더블링 타임(코로나19 확진자 수가 두 배 느는 데 걸리는 시간)을 분석했다 [Shim et al., 2021]. 연구결과, 3월 초와 6월 초의 Rt값은 각각 3.5~4.4, 3이상으로 분석됐다. 같은 기간 더블링 타임은 각각 2.8~4.5일, 3.6~10.1일로 나타났다.


vol.16_3.jpg

▲ 사회적 거리두기 수준과 이에 따른 조치 내용. 이창형 UNIST 교수팀은 2.1~6.15일의 기간을 7개로 나눠 연령별 사회적 거리두기 조치가 감염병 확산에 미치는 영향을 분석했다. [Choi et al., 2020]


수리모델은 확산 추세 예측뿐만 아니라 정부 방역정책 평가에도 쓰일 수 있다. 이창형 울산과학기술원(UNIST) 교수팀은 2020년 2월 1일부터 6월 15일까지의 서울‧경기 지역의 실제 역학 데이터를 이용해 연령에 따른 사회적 거리두기의 효과를 분석했다 [Choi et al., 2020]. 연구결과로 몇 가지 흥미로운 사실이 드러났다.


우선, 4월 24일까지 사회적 거리두기 강도가 높아져서 Rt값은 2.1971에서 1보다 훨씬 적은 값까지 대폭 감소하였다. 강도 높은 사회적 거리두기가 감염률 감소에 영향을 미친다는 것이다. 한편, 4월 24일에서 5월 6일에 해당하는 5-2기간 동안은 이태원 발 코로나19 집단 감염이 발생했을 때로, 코로나19 감염 환자 중 20~39세의 행동 변화가 발생했음을 알 수 있다. 이 때 Rt값은 급격히 2.4846까지 올랐다.


사회적 거리두기가 완화되면서 2차유행이 시작될 무렵인 4월24일부터 사회적 거리두기 강도를 실제 시행되었던 것과 비교하여 다양한 시나리오에 대해서 연령별 감염환자의 변화를 살펴보았다. 이는 사회적 거리두기의 영향력이 연령대별로 다르고, 젊은 인구보다는 고령 인구에게 더 영향력이 크다는 것을 시사한다. 또한, 연구진은 7개 기간 모두에서 강력한 사회적 거리두기가 시행됐다면 총 감염자 수는 44.6% 감소했을 것이라는 예상도 내놨다. 그러나 모든 기간 약한 사회적 거리두기를 유지했다면, 감염자 수는 지금보다 29.2% 증가했을 것으로 분석했다.


해외에서도 코로나19 완화를 위한 정책 효과 분석 연구들이 진행됐다. 이러한 수리모델 개발에는 인구 규모, 도시 여부와 같은 현지 상황은 물론, 사회적 거리두기, 접촉자 추적 및 마스크 효과 등 비약물적 중재 전략 효과까지 고려됐다 [Siraj et al., 2020]. 연구진은 새로운 코로나19 확진 사례가 증가 중인 만큼, 감염병 통제를 위해 지속적인 사회적 거리두기 조정과 적극적인 격리 노력이 필요하다고 강조한다 [T ariq et al., 2021].


이 밖에도 세계적으로 다양한 수리모델이 개발되고 있다. 코로나19 감염자·사망자 수 예측 및 필요 병상 추정 [Booton et al., 2021], 학교 폐쇄 및 사회적 거리두기 강도에 따른 감염자 수 예측 [ Dehning et al., 2020 ], 휴대폰 빅데이터를 이용한 인구 이동과 바이러스 전염 관계 추정 [Xiong et al., 2020] 등의 연구가 대표적이다.


vol.16_4.jpg

▲ 독일 막스플랑크 연구소 연구진은 독일의 코로나19 역학 데이터를 활용해 사회적 거리두기 강도에 따른 감염 확산 방지 영향을 분석하고, 그 연구결과를 2020년 7월 국제학술지 ‘사이언스(Science)’에 발표했다. 그림 속 실선은 실제 역학 데이터, 점선은 예상치를 나타내며 빨간색, 주황색, 초록색 선은 각각 약한 사회적 거리두기, 강력한 사회적 거리두기, 접촉 금지 조치를 나타낸다. [Dehning et al., 2020]


국내 수학계의 코로나19 예측 활동


국내 수학자들도 수학 모델링을 통해 코로나19 전파 양상 예측 및 정책 제안을 위해 힘을 모으기로 했다. 필자가 속한 국가수리과학연구소와 대한수학회는 지난 해 6월 ‘코로나19 수리모델링 태스크포스(TF)’를 발족했다. TF의 목표는 학제 간 협력을 통해 정책 수립에 도움이 될 과학적 예측 및 분석을 제시하는 것이다. 출범 후 지난 6월 19일 ‘수리모델링으로 분석한 코로나19 백신전략’ 워크숍까지 모두 7차례의 워크숍을 개최하며 협력 수준을 높이고 있다.


vol.16_5.jpg

▲ 코로나19 수리모델링 태스크포스가 발간한 ‘코로나19 수리모델링 TF 리포트’와 코로나19 수리모델링 워크숍 포스터. 지금까지 7차에 걸친 워크숍을 진행했다.


또한 작년 12월부터 매주 금요일 ‘코로나19 수리모델링 TF 리포트’도 발행하고 있다. 리포트에는 수리모델 및 인공지능(AI)으로 분석한 전국·시도별 코로나19 확산 예측, 슈퍼 전파 사례 등의 연구 결과가 실린다. 이 리포트는 질병관리청 및 방역당국에 제출되어 방역 정책 수립의 근거자료로도 활용된다.


6월 25일 기준 전국 Rt 일주일 평균값은 1.07로 향후 4주간 신규 확진자 발생 증가 추세가 이어질 것으로 보인다. 전 세계 과학자들의 연대와 노력으로 인류는 코로나19와의 싸움에서 점점 승기를 잡아가고 있다. 수학자들의 노력도 코로나19 종식까지 계속될 것이다. Rt값이 0인 보고서를 작성할 날이 머지 않았기를 기대한다.



References


1. Hwang, N. A., Jeong, B. Y., Lim, Y. C. and Park, J. S. Diseases data analysis using sir nonlinear regression model. Journal of The Korean Data Analysis Society, 2007;9, 49-59.


2. Lee, S. G., Ko, R. Y. and Lee, J. H. Mathematical modelling of the h1n1 influenza. Journal of the Korean Society of Mathematical Education Series E, 2010;24, 887-889.


3. Lee, J. M., Choi, D., Cho, G., and Kim, Y. The effect of public health interventions on the spread of influenza among cities. Journal of theoretical biology, 2012;293, 131-142.


4. Choi, B. and Rempala, G. A. Inference for discretely observed stochastic kinetic networks with applications to epidemic modeling. Biostatistics, 2012;13, 153-165.


5. Shim, E., Tariq, A., and Chowell, G. Spatial variability in reproduction number and doubling time across two waves of the COVID-19 pandemic in South Korea, February to July, 2020. International Journal of Infectious Diseases, 2021;102, 1-9.


6. Choi, Y., Kim, J. S., Choi, H., Lee, H., and Lee, C. H. Assessment of Social Distancing for Controlling COVID-19 in Korea: An Age-Structured Modeling Approach. International journal of environmental research and public health, 2020;17(20), 7474.


7. Booton RD, MacGregor L, Vass L, Looker KJ, Hyams C, Bright PD, et al. Estimating the COVID-19 epidemic trajectory and hospital capacity requirements in South West England: a mathematical modelling framework. BMJ Open. 2021;11(1): e041536.


8. Siraj A, Worku A, Berhane K, Aregawi M, Eshetu M, Mirkuzie A, et al. Early estimates of COVID-19 infections in small, medium and large population clusters. BMJ Glob Health. 2020;5(9): e003055.


9. Dehning J, Zierenberg J, Spitzner FP, Wibral M, Neto JP, Wilczek M, et al. Inferring change points in the spread of COVID-19 reveals the effectiveness of interventions. Science. 2020;369(6500).


10. Tariq A, Undurraga EA, Laborde CC, Vogt-Geisse K, Luo R, Rothenberg R, et al. Transmission dynamics and control of COVID-19 in Chile, March-October, 2020. PLOS Negl Trop Dis. 2021;15(1): e0009070.


11. Xiong, C., Hu, S., Yang, M., Luo, W., & Zhang, L. (2020). Mobile device data reveal the dynamics in a positive relationship between human mobility and COVID-19 infections. Proceedings of the National Academy of Sciences, 117(44), 27087-27089.


12. Simon, C. M. (2020). The SIR dynamic model of infectious disease transmission and its analogy with chemical kinetics. PeerJ Physical Chemistry, 2, e14.



출처: 기초과학연구원 코로나19 과학 리포트

https://www.ibs.re.kr/cop/bbs/BBSMSTR_000000001003/selectBoardArticle.do?nttId=20165&pageIndex=1&searchCnd=&searchWrd=