워드처럼 마음대로 교정 가능한 4세대 유전자가위 프라임 에디터(Prime Editor)

- MIT 브로드 연구소와 하버드와 MIT 데이비드 리우 교수...DNA 이중가닥을 자르지 않고, 외부 DNA 주입 없이 마음대로 교정

워드프로세서처럼 마음대로 교정할 수 있는 4세대 유전자가위 프라임 에디터(Prime Editor)가 발견돼 현재 전 세계 과학계가 들썩이고 있다.
 
DNA의 이중가닥을 자르지 않고(double-stranded breaks, DSBs) 혹은 외부에서 DNA 주입 없이, 컴퓨터 워드프로세서처럼 누구나 글을 마음대로 쓰고 지울 수 있는, 4세대 유전자 가위인 프라임 교정(Prime Editing), 즉 프라임 에디터(Editor)를 발견했다.
 
그 주인공은 2016년에 3.5세대라 불리는 염기교정(Base Editor) 유전자가위를 발견했던, MIT 공대의 브로드 연구소(Broad Institute)와 하버드와 MIT 공대의 생화학자(a chemical biologist)인 데이비드 리우(David R. Liu) 교수다.
 
영국 네이처(Nature)지는 2019년 8월 26일에 논문을 투고 받아 2019년 10월 10일에 승인하고, 논문이 매우 중요하고 긴박한지라 교정을 보기 전인 원고 초기 버전(early version of the manuscript)을 2019년 10월 21일에 발표 공개했다.
 
데이비드 리우 교수가 교신저자로 제1저자 등 10여명이 연구에 참여, ‘DNA의 이중가닥을 자르지 않고 혹은 외부에서 DNA를 주입하지 않고 게놈을 검색하고 대체할 수 있는 게놈 교정(Search-and-replace genome editing without double-strand breaks or donor DNA)’(Anzalone et al., Nature, 21 Oct 2019)란 논문을 공개했다. 정식 논문 발표는 2019년 10월 28일자 네이처 온라인판(Latest Research)에 게재된다.
 
다음 내용은 네이처뉴스(NatureNews) 과학기자인 하이디 레드포드(Heidi Ledford)가 네이처지에 기고한 ‘초-정밀 새로운 CRISPR 툴이 과다한 유전질환을 막을 수 있어(Super-precise new CRISPR tool could tackle a plethora of genetic diseases)’를 중심으로 소개하되 전체 내용은 필자가 추가해 소개한다.
 
1. 기존의 1세대~3.5세대 유전자 가위
 
1세대 유전자 가위는 2003년에 발견한 징크 핑거(Zinc Finger)이고 2세대 유전자 가위는 2011년에 발견한 탈렌(TALEN)이며, 3세대 유전자 가위는 2012년에 발견한 CRIPR-Cas9이다. 세대가 업그레이드 될수록 정확도가 높아진다. 3.5세대는 2015년에 발견한 CRISPR-Cpf1이다.
 
그 이후 2016년에 3.5~4세대라 불릴만한 염기교정 유전자가위(Base Editor)가 데이비드 리우 교수에 의해 발견됐다.
 
2. 크리스퍼/카스9(CRISPR/Cas9)란
 
크리스퍼(CRISPR) 박테리아의 유전체(게놈)에서 특이하게 반복되는 염기서열(base sequences) 부분으로 '주기적으로 간격을 띠고 분포하는 짧은 회문구조의 반복서열(CRISPR, Clustered Regularly Interspaced Short Palindromic Repeats)'이다. 이와 같은 CRISPRs는 박테리아(세균 포함) 게놈의 약 40%에서, 그리고 고세균(archaea) 게놈의 90%에서 발견된다.
 
CRISPR는 DNA다. 누구의 DNA냐 하면 바로 천적인 바이러스(Virus, 박테리오파지, Bacteriophage)의 DNA다.
 
바이러스 크기는 100나노이고 박테리아 크기는 1,000나노이므로 바이러스들은 박테리아를 쉽게 공격한다. 이를 이용한 항생제가 개발되기도 한다. 박테리아들은 침입하는 바이러스들의 DNA 일부를 Cas1(CRIPSR-associated protein 1)과 Cas2 단백질이 협력해 자르고 다듬어(cleavage and trimming) CRISPR 어레이(Array) 안에 차곡차곡 쌓아둔다.
 
이러한 DNA 일부들은 반복적인 염기서열(repetitive sequences, direct repeats) 사이에 위치하기 때문에 스페이서(사이, Spacer)라고 부르며, 스페이서는 비-반복적인 서열이다. 이렇게 차곡차곡 쌓아두는 과정을 스페이서획득(Spacer acquisition) 또는 스페이서기억(Spacer memory)이라고 한다. 비-반복적인 스페이서 염기서열은 프로토스페이서(원형스페이서)라고 불리는 침입한 바이러스의 일부 염기서열이다.
 
▲ 스페이서 획득 과정. Cas1과 Cas2 단백질이 협력해 침입하는 바이러스의 DNA를 인식하고 잘라 다듬으면, 그다음 말단 부착(End joining)이 일어나고, 그다음 양쪽의 단일 가닥을 오른쪽과 왼쪽으로 확장 시켜(Single strand extension), 맨 앞쪽의 최종 스페이서가 획득된다. 검은색은 반복적으로 나타나는 서열들이고, 스페이서들은 비-반복적으로 나타나는 특정 서열의 다양한 색깔들임. Credit: Wikipedia – CRISPR Amita Sorek(2016)
 
또한 동일 또는 유사한 바이러스가 침입할 때 스페이서에 저장해둔 CRISPR DNA 정보를 꺼내 CRISPR RNA(crRNA)로 전사(Transcription)시켜 crRNA를 만든다. 이 과정을 crRNA 프로세싱(Processing)이라고 한다.
 
그다음 crRNA와 Cas9이 함께 협력하여 침입하는 바이러스의 DNA만을 찾아 잘라(Cleave) 무력화시키는데, 이 과정을 간섭/면역(Interference/Immune)이라 한다.
 
이렇게 획득(기억)-crRNA 프로세싱-간섭/면역이라는 세 개의 주요 과정을 거치게 된다. 이는 박테리아가 바이러스로부터 자신을 보호하는 방어 시스템(Bacterial defense system) 또는 면역 시스템(Immune system)으로, 이들 메커니즘을 모방해 인공(인조) CRISPR/Cas9을 만드는 것이다.
 
이 과정을 보다 자세히 살펴보면 다음과 같다. 크리스퍼 어레이에는 그간 침입한 바이러스들의 일부 DNA 염기서열들을 가지고 있다. 그 크기는 다 다르지만, 전형적인 반복-스페이서 어레이(a repeat-spacer array)에는 대략 21~90 개정도의 염기쌍들로 이어져 있다.
 
또한 지금까지 발견된 Cas 유전자들(genes)은 다양한 단백질을 만드는데, 기능적으로 크게 ▲스페이서를 만드는 단백질, ▲ 크리스퍼 RNA (crRNA)의 발현에 관여하는 단백질, ▲ 목표 유전자를 인식하는 단백질, ▲ 목표 유전자를 자르는 단백질 등으로 나눌 수 있다(Makarova et al., 2015)
 
▲ 하나의 크리스퍼/카스 좌위(a CRISPR locus)의 간단한 그림. 3가지 구성요소로 이루어져 있는데, 왼쪽에는 Cas 단백질들을 엔코딩한 작은 클러스터(Small clusters)의 Cas 유전자들(Cas genes)이 있고, 그 다음 크리스퍼 어레이에는 하나의 선도서열(a leader sequence)과 하나의 반복-스페이서 어레이(a repeat-spacer array)가 있다. 이 3가지 구성요소들은 CRISPR마다 항상 같지는 않지만 일반적으로 나타나는 요소들이다. 반복들(Repeats)은 세로 바의 회색 박스들(gray boxes)이고 비-반복적인 서열을 가진 스페이서들은 침입한 바이러스들의 DNA를 Cas1과 Cas2 단백질이 잘라 차곡차곡 쌓아둔 서로 다른 색깔의 직선 바들(colored bars)이다. Credit: Wikipedia – CRISPR.

동일 또는 유사한 바이러스가 침입할 때 스페이서에 있던 바이러스 DNA가 CRISPR RNA(crRNA)로 전사(Transcription)되고, Cas9 유전자가 발현되어 Cas9(CRIPSR-associated protein 9) 단백질이 되어 짝을 이루어 작동하는 것이다.
 
crRNA는 침입하는 표적 바이러스의 특정 염기서열을 찾아내고, Cas9은 염기서열을 절단한다. crRNA는 유도, 즉 가이드(guide RNA, gRNA) 기능을 하고 Cas9는 절단, 즉 무력화 기능을 한다. 이를 3세대 유전자 가위라고 한다.
 
3세대인 크리스퍼/카스9이 주목받는 이유는 이전의 1세대인 징크 핑거 뉴클레아제(ZFN, Zinc Finger Nuclease)와 2세대인 탈렌(TALEN, Transcriptional Activator-like Effector Nucleases)에 비해 훨씬 간편하고 값싸고 보다 정확하기 때문이다.
 
더 나아가 크리스퍼/카스9는 가이드 RNA만 교체해 Cas9 단백질과 함께 세포로 전달하면 되기 때문에 재설계 및 대량 생산이 가능하고 원핵생물(prokaryotes)뿐만 아니라 동식물의 진핵세포(eukaryotic cells)에도 자유자재로 사용할 수 있다.
 
Cas는 등급(Class)에 따라 1과 2로 나뉘고, Cas의 종류(type)에 따라 I-II-III-IV-V로 나뉘는데, Cas9은 Class 2와 type II에 속한다. 과거에 엔도뉴클레아제(Endonuclease)의 일종인 제한 효소(Restriction enzyme)가 유전공학(Genetic engineering)에서 DNA 절단 효소로서의 핵심도구로 사용되었듯이 박테리아(세균 포함)에서 발견된 크리스퍼/카스9 시스템이 유전체(게놈) 공학(Genome engineering)의 핵심도구가 된 것이다.
 
3. 4세대 유전자 가위 ‘프라임 에디팅(Prime Editing)
 

CRISPR-Cas9 유전자 가위가 현재 널리 알려졌으나 아직은 해결해야 할 문제들을 갖고 있다. 투박하고(clunky) 오류가 발생하기 쉬우며(prone to errors or errors-prone) 의도되지 않은 결과를 가져올 수 있다.
 
그러나 데이비드 리우 교수팀이 개발한 프라임 에디팅(prime editing)은 이러한 단점을 극복해서 유전자 치료(gene therapies)를 개발할 수 있는 획기적인 툴로 떠오르고 있다. 이 툴을 이용하면 연구자들은 예측할 수 없는 변이와 오류 대신 결국 그들이 원하는 유전자 교정을 할 수 있다.
 
또한 데이비드 교수팀은 논문에서 비-표적 사이트(off-target sites)을 줄였다고 발표함으로써 CRISPR-Cas9이 보여주는 비-표적 절단을 막을 수 있으며, 워드프로세서처럼 누구나 사용할 수 있는 범용 툴이라 프라임 교정 베이스의 유전질환 교정이 가능하게 됐다.
 
데이비드 리우 교수팀의 논문에 따르면 “어느 날인가 과학자들은 이 툴을 이용해 미국 국립생물정보센터(ClinVar)에 리스트된 75,000개의 유전자 질환들(disease-associated DNA variants or pathogenic human genetic variants) 중 이론적으로는 89%를 교정할 수 있다”고 한다.
 
데이비드 리우 교수는 "따라서 과학자들은 랩(Lab)에서 이 툴을 이용해 각종 유전질환의 모델을 개발할 수 있으며 특정 유전자의 기능과 돌연변이 유전자의 원인을 연구할 수 있다"고 말한다.
 
프린스턴 대학의 유전자 교정을 연구하는 아담손(Brittany Adamson)은 “아직은 초기이지만, 연구 결과는 정말 환상적이다. 많은 사람들이 사용하게 될 것”이라고 말했다.
 
4. HDR/NHEJ
 
우리 몸에는 DNA가 망가지면 이를 자연적으로 복구시키는 2가지의 세포 메커니즘(the cell’s own repair system)이 있다.
 
비-상동말단부착(비상동재접합, NHEJ, nonhomologous end joining)은 CRISPR-Cas9 유전자 가위로 DNA의 이중가닥을 자르면(DSBs, Double Strand Breaks) 중간에 틈이 생긴다. 이 잘린 가닥을 이어주는 방법이고, 상동직접수선(상동재접합, HDR, homology-directed repair))은 염기서열이 동일한 상동 염기서열을 이용해 망가진 DNA를 복구(수선)하는 방식이다.
 
CRISPR-Cas9에 의해 절단된 DSBs는 내인성 DNA 복구 메커니즘에 의해 복구(수선)되는데, 가장 먼저 비-상동말단부착(NHEJ) 기전(기작)을 사용한다.
 
그런데 <3세대 유전자 가위-논문·특허기술 전쟁>(차원용, 28 Jul 2017)에서 살펴본 바와 같이 DSBs가 NHEJ로 복구되는 과정에서, DSBs 사이트들에는 무작위로 유도된 돌연변이의 삽입(insertions)과 결실(deletions)을 나타내는 이른바 인델(Indels)이 너무 다양한 패턴으로 많이 일어난다는 것이다.
 
따라서 분명한 것은 NHEJ는 유전자 교정 응용 프로그램에 적합하지 않다는 것이다.(Obviously, NHEJ is inappropriate for gene correction applications because it introduces additional mutations in the form of insertions or deletions at the DSB site, commonly referred to as indels).
 
하지만 어떤 경우에는, 표적 세포들은(targeted cells) 상동직접수선(상동재접합, HDR)이라 불리는 또 다른 대안적인 DNA 복구 기전을 활성화시켜 수선한다. 돌연변이가 없는 상동 염색체(non-mutant homologous chromosome) 또는 외부에서 공급된 하나의 DNA 분자(a supplied exogenous DNA molecule)를 하나의 주형(a template)으로 사용해 돌연변이 대립 유전자를 교정한다는 점이다.
 
그런데 2017년 8월 2일자 한국 김진수 박사와 미국의 슈크라트 미탈리포프(Shoukhrat Mitalipov) 박사팀의 논문을 보면(Ma et al., Nature, Published online 02 August 2017), 외부에서 주입한 주형을 이용해 복구가 일어나는 것이 아니라 모계의 정상 상동 염색체를 주형으로 사용하고, 인간이 가진 자연적인 복구시스템인 HDR를 이용해, 결실된 부계 대립유전자를 교정하고 있다는 사실이다.
 
이는 무엇을 의미하는 것일까? 1997년에 개봉된 SF 영화 가타카(Gattaca, 1997)의 환상이 깨졌다(No designer babies)는 것이다. 아직은 말이다.
 
우성 정상 유전자들을 주입하여 언젠가는 맞춤식 아기가 탄생하겠지만, 이 논문의 결과는 “외부에서 주입한 ssODNs을 주형으로 하여 복구되지 않았다는 것”이 중요한 연구 결과 중 하나라는 점이다.
 
따라서 Indels에 의한 NHEJ나 낮은 효율의 HDR을 대체할 새로운 툴을 찾아야 하는데 바로 프라임교정이다.
 
왜냐하면 프라임 교정은 교정하고 싶은 DNA 염기서열의 한 가닥만을 잘라내고 교정된 염기서열을 삽입하기 때문이다. 따라서 프라임 교정은 CRISPR-Cas9보다 더욱 정확하고 자유자제이며, HDR을 뛰어넘은 효율성과 교정의 순도라는 이점이 있다(product purity advantages over homology-directed repair).
 
5. 정밀 에디터(Precision Editor)
 
물론 프라임 교정에도 CRISPR-Cas9처럼 Cas9 효소를 사용한다. 그렇지만 CRISPR-Cas9의 Cas9처럼 DNA의 이중가닥을 절단하는 것이 아니라 오직 한 가닥만을 절단한다(nick). 그다음 역-전사 효소(reverse transcriptase enzyme)가 있는데, 하나의 RNA 주형을 복사하여 새로운 DNA를 생성한다.
 
그리고 하나의 ‘prime editing guide RNA = pegRNA’가 에디터(editor) 혹은 교정된 염기서열(edited sequence)을 표적 사이트로 보내면, 거기에서 Cas9가 DNA의 한 가닥을 자르고, 역-전사 효소가 교정된 염기서열의 RNA을 읽고 절단된 DNA의 말단에 상동 DNA 염기들(bases or letters)을 붙여 교정이 일어난다.
 
The prime editor complex includes a Cas9 enzyme, modified to only nick one strand of DNA, and a reverse transcriptase enzyme, which can generate new DNA by copying an RNA template). Credit: The Scientist(21 Oct 2019)
 
 
▲ 그리고 하나의 prime editing guide RNA = pegRNA가 에디터(editor) 혹은 교정된 염기서열(edited sequence)을 표적 사이트로 보내면, 거기에서 Cas9가 DNA의 한 가닥을 자른다(An engineered &ldquo;pegRNA = prime editing guide RNA&rdquo; sends the editor(= edited sequence) to its target, where Cas9 nicks one strand of DNA). Credit: The Scientist(21 Oct 2019).
 
▲ 역-전사 효소가 교정된 염기서열의 RNA를 읽고 절단된 DNA의 말단에 상동 DNA 염기들(bases or letters)을 붙여 교정이 일어난다(To transfer the edited sequence from the pegRNA to the target, the reverse transcriptase reads the RNA and attaches the corresponding DNA letters to the end of the nicked DNA). Credit: The Scientist(21 Oct 2019).
 
 
▲ 정밀 에디터(Precision Editor). ① = 프라임 교정 툴은 DNA의 한 가닥을 절단하고 교정 염기서열인 Y를 삽입한다. ② = 표적 사이트의 DNA 한 가닥을 자르면, ③ = 교정 대상의 염기서열이 잘려 나간다. ④ = 프라임 에디터는 상동 DNA 가닥을 자른다. ⑤ = 그러면 세포 복구과정인 HDR에 따라 주입한 Y로 가닥이 교정되어 결국 양쪽이 교정된다. Credit: Heidi Ledford, Nature, 21 Oct 2019.
 
 
6. 멀티 목적 툴(A multipurpose tool)
 
데이비디 리우를 비롯한 연구원들은 그 전에 삽입(insertions), 삭제(deletions) 혹은 DNA 염기 치환(DNA letter substitutions) 등을 고려해 왔다. 그러나 정밀한 치환에서 제약이 뒤따랐다. 3.5세대인 염기 교정(base editing)은 3세대인 CRISPR–Cas9가 하지 못하는 하나의 DNA 염기(letter)를 다른 것으로 바꿀 수 있다.
 
예를 들어 T(티민)->A(아데닌), G(구아닌)->C(시토신)이다. 이 염기 교정은 데이비디 리우가 2016년에 개발했다. 하나의 염기가 변이되어(single-letter mutations) 일어나는 유전질병 교정에는 적격인데, 바로 겸상적혈구빈혈증(sickle cell disease or anaemia)이다.
 
이 병은 유전자인 HBB에서 하나의 염기인 A가 T로 바뀌었을 때 발병한다. 그러나 문제는 하나의 염기가 아닌 여러 개의 염기들(multi-letter mutations)이 변이가 일어나는 것은 교정할 수 없다는 것이다. 바로 테이삭스병(Tay–Sachs disease)인데 유전자 HEXA 에서 단 4개 염기가 DNA에 잘못 삽입될 때 나타나는 질환이다.
 
그래서 이를 극복하고자 이번에 프라임 에디터를 개발한 것이다. 2018년에 데이비드 리우 연구팀은 DNA의 한 가닥을 절단하는 수정된 Cas9 효소를 비롯한 효소들의 조합체를 개발해 각각의 DNA 멀티 염기들을 교정, 즉 염기들을 삽입하거나 자르는 툴을 개발한 것이다.
 
리우 박사는 “첫 번째 연구가 방금 시작됐다. 이것은 끝이 아니라 이제 시작이다. 하나의 유기체에서 DNA를 교정할 수 있는 오랫동안 갈망했던(long-standing aspiration) ….이제 시작에 불과하다”라고 말했다. 
 
데이비드 리우 연구팀은 이중가닥 절단 없이, 그리고 외부 DNA 주형 삽입 없이, 표적 삽입과 절단 등을 포함한 175번의 인간 세포들과 12유형의 유전자 변이를 대상으로 실험해 이와 같은 결과를 얻어 논문을 발표했다.

 

차원용 공학박사/ 아스팩미래기술경영연구소 대표