3.5세대 유전자 가위(CRISPR/Cpf1) 논문 분석 2

- 펭 장 교수 팀, 새로운 CRISPR/Cpf1의 발견과 인간 세포대상 연구결과(2015)

요약: 생명과학자들은 최근 3세대를 넘어 보다 정확하고 표적에 특이적인 3.5세대 유전자 가위(CRISPR/Cpf1)를 발견하고 개발했다. 인간세포와 동식물세포의 유전자를 마음대로 교정하는데(Editing) 사용한다. 표적 DNA를 자른 후 세포 내 복구 시스템에 의해 다시 연결되는 과정에서 유전자 교정과 원하는 변이가 일어난다. 이 방식을 활용해 암과 AIDS 등뿐만 아니라 더 나아가 희귀난치병 치료나 작물•가축개량•미래식량(Clean meat) 분야에서 유전자 가위 혁명이 빠르게 확산되고 있다. 특정 유전자 부위를 정확하게 잘라 내 그 기능을 알아내는 데에도 사용되고, 쥐를 대상으로 특정 유전자를 제거/억제하거나(Knock-out) 특정 유전자를 삽입하여(Knock-in) 희귀 병을 가진 쥐를 만들기도 하는데, 종전에는 수 개월~수 년이 걸렸지만 유전자 가위를 이용하면 시간과 비용을 획기적으로 줄일 수 있기 때문이다. 이렇듯 인류는 세포 안에 있는 특정 유전자나 염기를 골라서 제거하거나 정상으로 바꿀 수 있는 유전자 가위 기술을 보유했다. 

본 보고서에서는 3.5세대 유전자 가위에 대한 논문 공개 순으로 내용을 살펴보고 분석해 인사이트를 제공하고자 한다. 아울러 논문분석이기 때문에 오류가 있을 수도 있다는 점을 알려드리는 바이다.

Feng Zhang
▲대학원생과 연구하는 펭 장(Feng Zhang) 박사.(사진 출처: MIT Edu)

글 싣는 순서

1장. Cpf1 발견의 과정 
2장. 펭 장 교수 팀, 새로운 CRISPR/Cpf1의 발견과 인간 세포대상 연구결과(2015) 
3장. CRISPR/Cpf1유전가 가위 전쟁(2016)

3-1. 김진수 교수 팀, 쥐의 표적 돌연변이유도와 털 색이 다른 쥐의 생성
3-2. 서울아산병원 및 울산의대, 녹아웃(Knockout) 마우스의 생성
3-3. 김진수 교수 팀, Cpf1의 정확성 입증 
3-4. 하버드대 케이스 정 박사 팀, Cpf1의 정확성 입증
4장. 네이처 바이오테크놀러지의 Cpf1의 정확도를 다트게임으로 묘사(2016)
5장. Discussion


2장. 펭 장 교수 팀, 새로운 CRISPR/Cpf1의 발견과 인간 세포대상 연구결과(2015)

미국 MIT, MIT와 하버드대학의 공동연구소인 브로드연구소(Broad Institute)의 펭 장(Feng Zhang, 교신저자) 박사를 중심으로 하는 국제연구팀이 유전자 교정(Genome Editing)을 위한 새로운 유전자 가위(DNA-cutting)인, 3.5세대의 “단일 RNA가 가이드하는 Cpf1 엔도뉴클레아제의 클라스 2의 크리스퍼-카스 시스템(Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2 CRISPR-Cas System)”을 발견해 논문을 발표했으며(Zetsche et al., Cell, 25 Sep 2015),  이에 대한 보도가 이 따랐다. (Science Daily)

특히 이번 논문을 발표한 주인공들은 앞서 살펴본 2013년에 동물(쥐)과 사람의 유전자를 교정하는데 필요한 3세대 크리스퍼-카스9(CRISPR-Cas9) 시스템을 개발했던 장본인들로(Cong et al., Science, 15 Feb 2013), 보다 간단하고 보다 정확한 방법으로(simpler and more precise) 잘못된 유전자를 잘라내 교정할 있는 3.5세대 세대 유전자 가위를 발견한 것이다. 이번에 발표된 논문에서 장 교수 팀은 이 기대치 않은 전혀 새로운 시스템의 기능들을 서술하고 있으며, 동시에 인간 세포들의 유전체(게놈)를 수정할 수 있음을 데모하고 있다. 이번 연구는 전에 발견된 크리스퍼 시스템의 밝혀지지 않은 기능들을 밝히고 있을 뿐만 아니라, 더 나아가 Cpf1과 단일 RNA로 구성된 가위가 인간의 유전자를 수정할 수 있는 차세대 기술임을 밝히고 있다. 

장 박사와 동료들은 서로 다른 박테리아에서 수백 가지의 Cpf1 시스템들을 탐색했고, 인간 세포를 수정할 수 있는 Cpf1 효소들을 찾아냈다. 그 결과 Francisella novicida에서 FnCpf1을, Acidaminococcus sp.에서 AsCpf1을, Lachnospiraceae bacterium에서 LbCpf1 등의 16가지 효소들을 찾아냈고, 그 다음 인간 세포들의 유전자 좌위(loci)를 표적으로 절단 실험한 결과를 데모했다. 이새로운 Cpf1 시스템은 전의 Cas9보다 여러 중요한 관점에서 차별성을 보이고 있는데, 향후 연구와 치료학(therapeutics)에 중대한 의미를 지닐 뿐만 아니라 상업적인 비즈니스와 지적재산권(IP)에 엄청난 영향을 미칠 것으로 과학계는 보고 있다. 연구팀이 찾아낸 Cpf1의 주요(차별화) 내용을 보면 다음과 같다.

첫째, 자연의 형태에서, 유전자 가위 효소인 Cas9는, 자르는 활동에 필요한 두 개의 작은 RNA인crRNA:tracrRNA로 이루어진 복합체(complex)를 만들어 결국 Casp9-crRNA:tracrRNA이라는 삼원 복합체(ternary complex)가 작동한다. 그러나 Cpf1은 간단해서 오로지 하나의 단일 crRNA만이 필요하다. 또한 Cpf1 효소는 표준인 SpCas9보다 더욱 작아서, 조직이나 세포로 쉽게 전달 할 수 있다. 그 만큼 표적(On-targets)과 정확성(Precision)이 높다. 결국 Cpf1:crRNA복찹체로만 절단이 가능하므로 보다 간편하고 안정성이 높으며, crRNA의 길이도(~42 nt) Cas9의 crRNA(~100 nt) 보다 짧아 제작도 수월하다.

1▲<그림> Cpf1:single crRNA의 그래픽 요약. Cas9은 표적 유전자의 3’-말단에 PAM이 위치하지만(그림상 오른쪽), Cpf1에서는 표적 유전자의 5’-말단에 위치하고 있음을 발견함(그림상 왼쪽). Image: Zetsche et al., Cell, 25 Sep 2015.

둘째, 아마 가장 중요한 것으로, Cpf1은 Cas9 보다 DNA를 자르는 방법이 틀리다. Cas9이 DNA를 자를 때에는, 똑같은 장소에서 DNA의 두 가닥을 나란히 잘라내서, 그 결과 깔끔하게 잘린다는 특징인 두 가닥 말단들(blunt ends)을 남기는데, 이 말단들이 복구과정에서 재결합할 때 돌연변이들(mutations)을 일으키기도 한다. 그러나 Cpf1를 사용하면 두 가닥의 절단 부분들이 상쇄되면서(offset), 두 가닥의 5’-노출 말단들(exposed ends) 위에는 4-nt 혹은 5-nt의 짧은 서열들이 걸려서(short overhangs) 솔기 모양으로 남게 되는 끈적한 부착/접착말단(Sticky end)이 된다. 따라서 복구과정에서 상보적인 서열들이 부착말단에 붙는 상동직접수선(homology-directed repair, HDR)을 통해 돌연변이들을 줄일 수 있다는 것이며, 더욱이 이런 특징은 정확한 표적의 플라스미드 DNA 삽입(precise insertion)을 가능하게 하여, 연구자들로 하여금 효율적으로 정확하게 삽입하는 DNA의 조각들을 간단하게 통합해줄 수 있다는 것이다.

셋째, Cas9은 표적 유전자의 3’-말단에 PAM이 위치하지만(3’-NGG), Cpf1에서는 표적 유전자의 5’-말단에 위치하고 있다(5’-TTN). Cas9은 인식된 PAM으로부터 3번째와 5번째 염기 쌍 사이를 추정하여 절단하게 되지만, Cpf1은 인식된 PAM으로부터 더 먼 곳에(far away) 있는 양쪽 18번과 23번 서열 사이의 5-nt를 얼기설기 잘라(a 5-nt staggered cut, 엇갈림 절단), 만약 표적 유전자가 표적 사이트에서 돌연변이 되었다면, 아직도 다시 자를 수 있는(re-cut) 여지가 남아, 보다 정확한 교정이 일어나도록 다양한 방법과 기회들을 제공한다는 것이다. 또한 Cas9와 Cpf1의 PAM 부위가 서로 상반되기 때문에 각각 적용하기 힘든 부위에도 서로 보완 적용이 가능하다는 장점이 있다는 것이다.

넷째, Cpf1은 자르고자 하는 표적 사이트를 선정하는데 융통성이 있다. Cas9처럼 Cpf1 복합체도 처음에는 PAM이라 알려진 짧은 염기서열을 붙여야 한다. 하지만 Cpf1은 Cas9와는 다르게 인식하는데, Cas9의 경우 NGG처럼 구아닌(Guanine)이 많은 G-rich PAM(guanosine-rich)이 있는 부위의 염기를 잘라내는 반면, Cpf1은 TTN처럼 티민(Thymine)이 많은 부위(T-richPAM,thymidine-rich PAM)를 효율적으로 절단한다. 그러므로 인간뿐만 아니라 말라리아 기생충까지의(malaria parasite) 게놈을 표적 할 수 있다는 것이다. 

셋째, 연구결과 기원이 동일하여 형태나 발생에서 유사성을 가지는 종분화적 상동성들(오솔로지, orthologs)에서 16개의 Cpf1-과(科, Family)를 찾아, 그 중 오로지 두 개의 후보 효소들인, Acidaminococcus sp.에서의 AsCpf1과 Lachnospiraceae bacterium에서의 LbCpf1 이  인간 세포에서 가장 효율적인 유전체-교정 활동을 하는 것(efficient genome-editing activity in human cells)을 밝혀냈다. 이상을 요약하면 <표1>과 <그림 1A>과 같다.

2

3▲<그림 1A> Francisella novicida U112에서 찾아낸 Cpf1과 Cas9 CRISPR Locus의 체계 및 비교. Cpf1은 HNH 영역이 없으므로, Class 2의 Type V. Image: Zetsche et al., Cell, 25 Sep 2015. 

자 이번엔 Francisella novicida에서 정제한 FnCpf1과 crRNA만으로도 표적 유전자를 절단하는지 in vitro에서 실험한 결과를 보자.

4▲<그림 3A> 길이가 42개의 nt로 이루어진 crRNA와 프로토스페이서(1)의 DNA 표적 복합체(FnCpf1:crRNA)의 개략도. 절단 사이트는 빨강색 화살표로 표시된 곳인데, 위의 비상보적과 아래의 상보적 DNA의 위치가 1:1 방식이 아니라 5개의 염기들 사이에 엇갈려 있어 얼기 설기로 자름(staggered cut). Image: Zetsche et al., Cell, 25 Sep 2015. 

5▲<그림 3B> (B) FnCpf1과 crRNA으로만도 표적 DNA를 효과적으로 절단함. 단 이 때 Mg++를 추가해야 함. (C) FnCpf1과 crRNA으로만도 플라스미드 DNA를 절단해 선형의 생성물과 선형의 DNA를 효과적으로 자름. Image: Zetsche et al., Cell, 25 Sep 2015. 

자 이번에는 본 논문의 핵심 내용을 살펴보자(<그림 3D>). 하도 중요한 것 같아 논문의 그림을 확대하고 필자가 박스처리를 했다. 이 것은 FnCpf1이 절단한 사이트를 분석하기 위해 절단된 DNA말단들을 생거 씨퀀싱(Sanger sequencing)을 사용하여 매핑한 것이다. 그 결과 절단된 곳은 crRNA와 비-상보적인 가닥(+) 5’ 말단의 PAM이 있는 곳으로부터 5개의 nt와 상보적인 가닥(-)의 5개의 nt가 역방향 순으로 얼기 설기 혹은 지그 재그 혹은 엇갈려 걸쳐 잘린 것(5-nt5’overhangcut)을 발견했다. 이것은 Cas9이 1:1 방식으로 나란히 자르는 것과는 대조되는 것이다.

6▲<그림 3D> FnCpf1-절단 표적에서 생거 서열 추적은 5-nt가 얼기 설기 절단을 보여줌. N으로 표시된 추가적인 아데닌(adenine)의 비-템플리트 첨가는, 서열 분석에 사용된 폴리머라제의 인공산물. 필자가 빨강색 박스로 처리한 염기들은 남아 있는 접착말단. 오리지널 이미지를 필자가 박스 처리함. Image: Zetsche et al., Cell, 25 Sep 2015.

이 얼기설기 절단 사이트(staggered cleavage site)는 PAM으로부터 멀리 떨어져 있는데, 비-상보적인 가닥(+)의 절단은 18번째 염기 이후부터 오른쪽으로 절단이 일어나고, 상보적인 가닥(-)의 절단은 23번째 염기 이후부터 왼쪽으로 절단이 시작된다. 결국 양쪽 18번과 23번 사이의 5-nt를 얼기설기 자른 것이다. 그 결과 두 가닥의 5-nt 절단 부분들이 상쇄되면서(offset), 5’-노출 말단들(exposed ends) 위에는 4-nt 혹은 그 이상의 짧은 서열들이 걸려서(short overhangs) 솔기 모양으로 남게 되는 끈적한 부착/접착말단(Sticky end)이 된다. 따라서 복구과정에서상동직접수선(homology-directed repair, HDR)에 의해 상보적인 서열들이 부착말단에 붙어 돌연변이들을 줄일 수 있다는 것이다. 

자 이번엔 5’-TTN PAM이 존재해야 절단이 일어남을 증명한 것을 보자. 장 교수 팀은 서로 다른 PAM 서열을 가진 1~5개의 PAM을 올리고뉴클레오티드를 대상으로 실험한 결과 반드시 TTN이란 서열의 PAM이 있어야 절단이 일어남을 확인했다(<그림 3E>).

7▲<그림 3E> 1번 서열인 TTa로 이루어지는 TTN 서열이 있어야 1번과 같이 절단이 일어남을 확인. 오리지널 이미지를 필자가 박스 처리함. Image: Zetsche et al., Cell, 25 Sep 2015.

자 이번에는 Cpf1의 RuvC-like 도메인 영역을 보자. Cpf1의 RuvC-like 도메인은 엔도뉴클레아제 계열의 모든 촉매 잔기들(all of the catalytic residues)을 유지한다. 그러므로 하나의 활성 뉴클레아제(핵산분해효소)로 예측된다. 이것을 증명하기 위해 연구팀은 3가지의 돌연변이들을 만들었는데, 그것들이 FnCpf1(D917A), FnCpf1(E1006A), 그리고 FnCpf1(D1225A)으로, 보존된(유지된) 촉매 잔기들이 FnCpf1의 핵산분해효소 활성에 필수적인지를 시험하였다(<그림 4A>). 그 결과 D917A와 E1006A 돌연변이는 절단 활동이 완전히 일어나지 않았고(절단 취소), D1225A는 절단 활동이 급격히 줄었다. 반면 Cas9에서의 돌연변이 RuvC(D10A)와 돌연변이 HNH(N863A)는 절단이 안 일어났다(<그림 4B>)..

이것은 무엇을 의미하는가 하면, 이러한 결과는 FnCpf1의 RuvC-like 도메인이 표적 DNA의 두 가닥을 절단하고 있다는 것을 제안하는 것이고 또한 아마도 RuvC-like 도메인은 하나의 이량체의 구성으로(a dimeric configuration) 존재 하고 있음을 시사하는 것이다.

8▲<그림 4A & 4B> 표적 DNA 절단을 위해 FnCpf1은 RuvC-like 도메인이 필요. Image: Zetsche et al., Cell, 25 Sep 2015.

자 이번에는 FnCpf1절단 활동에 필요한 crRNA의 스페이서 길이의 효과와 crRNA와 표적 DNA사이의 불일치(mismatch)의 효과를 보자. 연구팀은 in vitro에서 서열들을 조사하여, crRNA가 표적 DNA 절단 위치를 인지(감지)하는데 최소 16-nt가 필요하고, 효율적인 절단을 위해서는 최소 18-nt가 필요하다는 것을 알아냈다(<그림 5A>). 그다음 crRNA와 표적 DNA사이의 불일치에서는 대략 처음 5-nt 내에 매치가 있어야 절단 효율이 좋다는 것을 발견했다(<그림 5A>). 이것은 Cas9과 마찬가지로 처음 매치가 중요하다는 것을 상기시키는 것이다.

9▲<그림 5A> in vitro에서 FnCpf1 Nuclease Activity을 위한 crRNA의 요구사항(Requirements). FnCpf1절단 활동에 필요한 crRNA의 스페이서 길이의 효과. 효율적인 절단을 위해서는 최소 18-nt가 필요. Image: Zetsche et al., Cell, 25 Sep 2015.

10▲<그림 5B> in vitro에서 FnCpf1 Nuclease Activity을 위한 crRNA의 요구사항(Requirements). (B) FnCpf1절단 활동에서 crRNA와 표적 DNA사이의 불일치(mismatch)의 효과. 처음 5-nt 내에 매치가 있어야 절단 효율이 좋음. Image: Zetsche et al., Cell, 25 Sep 2015.

다음은 종분화적 상동성들(orthologs)에서 16개의 Cpf1을 찾아, 그 중 오로지 두 개의 후보 효소들인, Acidaminococcus sp.에서의 AsCpf1과 Lachnospiraceae bacterium에서의 LbCpf1 이 인간 세포에서 가장 효율적인 유전체-교정 활동을 하는 것을 밝혀낸 연구결과를 보자. 우선 FnCpf1을 포함한 16개 후보들 중 FnCpf1과 같이 5’-TTN 서열의 PAM을 가지고 있는지를 조사하여 7개를 찾아냈고, 그 다음 FnCpf1을 포함하는 8개 각각의 Cpf1-단백질(효소)의 절단 활동을 테스트하기 위해 표적 사이트로 인간의 DNMT1 유전자를 표적으로 선정했다(<그림 7B>). 

11▲<그림 7B> 16개 각각의 Cpf1-단백질(효소)의 절단 활동을 테스트하기 위해 표적 사이트로 인간의 DNMT1 유전자를 표적으로 선정. Image: Zetsche et al., Cell, 25 Sep 2015.

그 결과 DNMT1을 표적으로 하는 각각의 crRNA를 가진 8개의 Cpf1단백질들이 시험관(in vitro) 내에서 DNMT1 게놈 영역의 PCR 증폭산물(a PCR amplicon)을 절단 할 수 있다는 것을 발견했다(<그림 7C>의 위). 하지만 인간배아신장 293FT 세포들(HEK293FT, human embryonic kidney 293FT cells)에서 테스트했을 때(in vivo), 8개 중 오로지 2개에서만(7, AsCpf1 and 13, LbCpf1) 인델(Indels) 수치가 검출되었다(<그림 7C의 아래>).. 

12▲<그림 7C> (위) in vitro에서 8개의 Cpf1단백질들이 표적DNMT1 게놈 영역의 PCR 증폭산물을 절단함. (아래) 인간배아신장 HEK293FT 세포들(HEK293FT, human embryonic kidney 293FT cells)에서 테스트했을 때(in vivo), 8개 중 오로지 2개에서만(7, AsCpf1 and 13, LbCpf1) 인델(Indels) 수치가 검출됨. Image: Zetsche et al., Cell, 25 Sep 2015. 

연구팀은 더 나아가 추가적인 게놈표적을 대상으로(<그림 7D>), AsCpf1과 LbCpf1의 절단 활동을 테스트한 결과, AsCpf1와 LbCpf1이 HEK293FT cells 에서 게놈 교정을 활발하게 매개하고 있다는 것을 발견했다(<그림 7E>). 반면 나머지 6개의 Cpf1 단백질들에서는 전달 활동이 전혀 검출되지 않거나 혹은 산발적인 활동만이 검출되었다. 그리고 SpCas9과 비교했을 때, AsCpf1와 LbCpf1은 비교할만한 수준으로 인델 형성(indel formation)을 매개했다(<그림 7E>). 

13▲<그림 7D & 7E> (D) 인간 DNMT1와 EMX1 유전자 죄위(loci)에서의 Cpf1과 SpCas9의 표적 서열(target sequences). Cpf1은표적서열이 23-nt, SpCas9은 20-nt. (E) Cpf1과 SpCas9의 게놈 교정 효율의 비교(Comparison of Cpf1 and SpCas9 genome-editing efficiency). Image: Zetsche et al., Cell, 25 Sep 2015. 

 

크기변환_사본-10632695_637493523030856_2757249799481243589_n차원용 소장/교수/MBA/공학박사/미래학자

아스팩미래기술경영연구소(주) 대표, (전)국가과학기술심의회 ICT융합전문위원회 전문위원, 국토교통부 자율주행차 융복합미래포럼 비즈니스분과 위원, 전자정부 민관협력포럼 위원, 국제미래학회 과학기술위원장

2 COMMENTS