기능과 변이의 원리
단백질은 구조가 기능 결정…아미노산 서열이 핵심
복제 오류로 서열에 변화 생기면 단백질 기능 변화
변이체의 생존 경쟁은 속도전…남보다 늦으면 도태
오미크론, 빠른 전파 속도로 집단면역·방역망 뚫어
이전 칼럼에서 바이러스의 본질은 자기 복제 정보라고 하였다. 이번에는 그 정보의 변화 (돌연변이)로 인해 코로나19의 전파 능력이 달라지는 변이의 출현 원리를 살펴볼 것이다.
유전자에 담긴 것은 단순한 정보일 뿐이다. 이 정보대로 생명의 기능을 수행하는 일꾼이 바로 단백질이다. 감염 같은 바이러스의 기능을 포함해 모든 생명 현상은 단백질에 의해 이루어진다. 아무리 복잡해 보이는 생명도 단백질과 유전자라는 두 중합체에 의해 유지된다. 중합체는 레고 조각을 반복적으로 연결해 만든 긴 막대기처럼, 기본 구성 요소가 반복적으로 결합한 것을 말한다. 여기서 유전자의 레고 조각은 4종류의 핵산이며, 단백질의 레고 조각은 20종류의 아미노산인 셈이다. 유전자와 단백질은 중합체라는 공통점은 있지만, 핵산과 아미노산의 물리 화학적 특성의 차이 때문에 유전자는 안정적이고 단백질은 다양한 구조 형성이 가능하다. 이런 특성을 바탕으로 유전자는 정보의 안정적 보관을 담당하고, 단백질은 다양한 기능의 구현을 담당하는 생명의 기본 원리가 작동한다.
핵산들은 크기나 화학적 특성이 비슷해 특정한 구조가 없이 긴 실 형태의 유전자가 만들어진다. 하지만 단백질을 구성하는 아미노산들은 크기와 화학적 특성이 다양하기 때문에, 중합 과정에서 저절로 접히고 꼬이고 뭉쳐져 일정한 형태의 구조를 만들게 된다. 이렇게 만들어지는 단백질의 삼차원 구조가 바로 기능을 수행하는 것이다. 즉 단백질의 구조는 기능과 동일한 의미다. 만약 아미노산의 결합 순서가 동일하면 항상 동일한 구조의 단백질이 만들어진다. 결국 아미노산의 결합 순서가 그 단백질의 기능을 결정하며 이 정보가 바로 유전자에 저장되어 있는 것이다. 이처럼 유전 정보에서는 순서가 중요하기에 서열 (sequence)이라는 용어를 사용한다.
설계도가 저절로 집이 되지 않는 것처럼, 유전자의 정보가 저절로 단백질이 되지는 않는다. 생명의 기본 단위인 세포는 유전 정보를 단백질로 만들어 주는 공장을 가지고 있다. 이 단백질 생산 공장은 세균에서 사람의 세포까지 모든 생명의 전제조건이다. 그런데 바이러스는 단백질 공장은 고사하고 기본 재료인 핵산이나 아미노산조차 가지고 있지 않다. 대신 숙주 세포를 떠돌며 공장을 몰래 사용한다. 외부에 떠도는 바이러스 입자는 무생물이지만 숙주 세포로 들어가면 생명이 되는 이중성을 갖는 것이 이런 이유다. 감염을 통해 숙주 세포 안으로 들어가면 세포의 단백질 공장은 바이러스 유전자에 포함된 정보대로 단백질을 만들기 시작한다. 단백질 공장은 유전 정보가 자기 것인지 바이러스 것인지 구분하지 못하기 때문이다.
▲ 코로나19 바이러스 구조도. Korean J Clin Lab Sci. 2020;52:297-309
https://doi.org/10.15324/kjcls.2020.52.4.297.
돌연변이는 왜 스파이크 단백질에 집중돼 있나
이전 칼럼에서 바이러스 유전자는 자기 유전자를 복제하는 단백질, 숙주세포의 기능을 교란시키는 해킹 단백질, 그리고 자기 유전자를 포장하는 입자 단백질의 정보를 담고 있다고 하였다. 이 세 가지 정보들은 바이러스의 기능적 중요성에서 큰 차이가 있다. 특히 첫 번째 중합 효소 단백질 정보가 바이러스의 핵심이다. 기본 단위인 핵산을 하나씩 차례로 연결해 유전자라는 긴 중합체를 만들기 때문에 ‘중합’ 효소라는 이름을 가지고 있다. 중합 효소는 자신의 유전자를 복제해 내는 생명의 기본 기능을 담당하는 단백질이다. 그런데 바이러스의 중합 효소 단백질은 원시적이기 때문에 유전자 복제 과정에서 오류가 빈번하게 일어난다. 위에서 설명한 대로 서열이 구조를 결정하기 때문에, 오류로 인해 서열에 변화가 생기면 만들어지는 단백질의 구조 즉 기능도 변한다. 이것이 코로나19의 유전자 복제에서 일어나는 돌연변이가 기능 변화로 연결되는 과정이다.
해킹 단백질은 숙주 세포의 신호 전달을 방해하거나 속여서 바이러스 단백질 생산에 유리한 환경을 조성한다. 하지만 나노 크기의 바이러스 입자가 품을 수 있는 유전자 크기는 한계가 있어 다양한 해킹 정보를 가지고 다닐 수 없다. 따라서 특별한 세포 환경에서만 제대로 작동하도록 집중하게 되었다. 이런 특별한 환경을 가진 세포가 바로 숙주세포가 되는 것이다. 간단히 말하면 바이러스와 숙주세포에는 궁합이 존재한다. 조류 독감 바이러스가 사람을 직접 감염시키지 못하는 현상을 종간 장벽이라 하는데 이것이 바로 바이러스와 숙주세포 궁합이 달라서 발생하는 현상이다.
돌연변이는 복제 과정에서 무작위로 발생하기에 바이러스 유전자의 어디에서라도 동일한 확률로 발생한다. 하지만 바이러스의 중합 효소와 해킹 단백질은 수십억 년 동안 표적 숙주 세포에서의 복제와 증식에 적합하게 서열이 다듬어져 왔다. 지구 역사상 유례가 없는 단일 지배종인 사람의 경우는 바이러스가 증식할 수 있는 세포 내부 환경이 모두 동일하다. 현재 코로나19의 관점에서 사람은 유전자를 마음껏 퍼트릴 수 있는 광활한 블루오션이나 다름이 없다. 하지만 이를 반대로 생각해 보면 사람 세포에 최적화된 정보의 돌연변이로 인한 구조 변화의 대부분은 치명적이라는 걸 의미한다. 자기 복제에 실패한 돌연변이 유전자는 절멸된다. 이런 이유로 현재 사람들을 감염시키는 코로나19 유전자 서열을 분석해 보면 이 핵심 정보 부분에서는 돌연변이가 잘 관찰되지 않는다. 이는 이 부분에 돌연변이가 일어나지 않기 때문이 아니라 이 부분에 돌연변이가 일어난 유전자는 대부분 도태되었기 때문이다.
이 현상과는 반대로 입자를 포장하는 단백질 정보를 가진 유전자 부위에서는 수많은 돌연변이가 관찰된다. 이 부위의 정보는 변화하는 전파 환경에 대응하는 새로운 기능 변이가 끝없이 선택되기 때문이다. 코로나 바이러스 입자는 숙주 세포에서 훔친 세포막을 주성분으로 바이러스 유전자가 만들어낸 구조 단백질이 결합해 만들어진다. 구조 단백질은 유전자를 보호하는 포장 기능과 완성된 입자를 새로운 숙주세포로 전달하는 주소 기능 두 가지를 가진다. 특히 이 주소 기능이 바이러스의 확산에 핵심 역할을 수행한다. 무생물인 바이러스 입자는 스스로 자기 숙주를 찾아다닐 수 없다. 또한 일단 세포에 들어가면 환경이 적합하지 않다고 되돌아 나올 수도 없다. 한번 들어가면 복제에 성공하든지 사라지든지 둘 중 하나다. 바이러스는 한 번뿐인 기회를 제대로 확인하기 위해 입자 표면에 탐침처럼 솟아 있는 돌기를 이용한다. 이 돌기가 숙주세포 표면의 특별한 수용체와 결합하며 안으로 들어간다. 이 특별한 수용체는 바이러스에 이 세포의 내부 환경이 복제에 유리한 환경이라는 것을 알려주는 일종의 문패인 셈이다. 코로나 바이러스가 가진 탐침 역할을 하는 돌기의 이름이 바로 스파이크 단백질이다. 아마 인류 역사상 언론에서 가장 많이 보도된 단백질일 것이다.
지난 2년간 발생한 수많은 코로나19의 변이 대부분은 스파이크 단백질 유전 정보에 돌연변이가 집중되어 있다. 생물학에서 변화는 경쟁에 의해 유발된다. 스파이크의 빈번한 변이는 치열한 경쟁에 의해 유도된 것이다. 바이러스는 부모도 형제도 동료도 없는 이기적인 유전자의 정수이다. 하나의 숙주세포에서 같이 만들어진 바이러스들이라도 각각 자기 복제만을 위해 경쟁한다. 코로나19 변이들의 생존을 걸고 하는 경쟁은 속도로 승패가 결정된다. 코로나19에 감염되면 면역이 형성되기 때문에 늦게 전파되는 변이 유전자는 도태된다. 반대로 빠르게 전파되는 변이는 성공적인 복제를 거쳐 다시 전파가 된다.
전파의 속도를 결정하는 것은 스파이크 단백질의 구조다. 스파이크 부위 변이들은 다음 세 단계의 과정을 거쳐 일어난다.
1. 유전자 복제 과정에서 스파이크 서열 정보에 돌연변이가 발생한다.
2. 돌연변이 유전자에 의해 만들어지는 스파이크 단백질 구조가 변한다.
3. 구조 변화로 숙주 세포의 표적 수용체와 더 잘 결합하게 되면 전파에 유리해진다.
1번 돌연변이 발생 단계에서는 그 결과가 전파에 미치는 영향을 알 수 없다. 무작위로 복제 오류가 발생하기 때문에 수용체 결합능력이 더 떨어지는 구조가 만들어질 수도 있다. 이렇게 기존보다 기능이 떨어지는 경우는 전파 경쟁에 밀려서 자연 도태가 된다. 대신 더 뛰어난 능력을 획득하는 경우는 성공적 전파와 복제가 반복되면서 점차 우세종이 된다. 이런 관점에서 보면 변이는 유전자 정보 변화와 그것으로 일어나는 단백질 기능 변화를 실제 환경에서 실험하는 과정이 계속 반복되면서 등장하는 것이다.
▲ 단백질의 아미노산 서열과 구조의 연관 관계
(이미지 출처: Dhiraj Mannar et al. SCIENCE. 20 Jan 2022.)
시행착오 거치며 목표 도달…진화 과정과 동일
위 그림은 가장 최근에 등장한 변이인 오미크론의 스파이크 단백질의 아미노산 서열과 실제 3차원 구조를 보여준다. 위는 처음 발견된 코로나19의 서열에서 돌연변이가 생긴 부위를 표시한 것이며, 아래는 돌연변이가 영향을 미치는 단백질의 구조를 빨간 점으로 표시한 것이다. 오미크론의 스파이크 부위에는 이전 우세종이었던 델타보다 2.5배 많은 36개의 돌연변이가 집중되어 있다. 그만큼 구조 변화가 크고 기능도 대폭 변하게 된 것이다.
정리하면 전파 속도의 기능적 우위라는 목표를 향해 시행착오 (trials and errors)를 반복하는 것이 코로나19의 변이 과정이다. 근본적으로 이는 진화와 동일한 과정이다. 차이점이라면 사람의 경우 유전 정보에 변화가 일어나고 실험되기 위해서는 한 세대가 필요하지만, 바이러스는 순식간에 그 과정이 진행된다. 진화에는 방향성이 없다고 오해하는 경우가 많다. 하지만 돌연변이 등의 유전 정보의 변화 발생이 무작위인 것이지, 그 변화가 생존 경쟁을 통해 실험되고 선택되는 과정에는 방향이 존재한다. 이 방향을 결정하는 것이 바로 선택 압력이다. 코로나19의 경우 선택 압력은 집단 면역과 방역이며 이를 뚫어내는 것이 바로 전파 속도이다. 선택 압력을 이겨낸 변이가 등장하면 델타나 오미크론 같은 우려 변이가 되는 것이다. 편의상 코로나19라고 묶어서 말하지만, 우리 주변에 돌아다니는 바이러스들의 유전자가 100% 동일한 경우는 드물다. 심지어 같은 오미크론이라도 돌연변이로 인해 유전자의 다양성이 늘어나고 있다. 현재, 이 다양한 유전자들은 선택 압력 아래에서 계속 실험되고 있으며, 성공하면 다시 새로운 변이가 등장하게 되는 것이다.
주철현 (울산의대 미생물학 교수)
출처: https://www.hani.co.kr/arti/science/science_general/1028843.html