활동·스터디/바이오및뇌공학

[바이오및뇌공학과세미나] Decoding Our Second Genome for Microbiome Medicine - 연세대 이인석 교수

푸른달열하나 2024. 4. 18. 20:47

 

금일 강의는 이인석 교수님의 Decoding Our Second Genome for Microbiome Medicine 강의였습니다. 이는 인간 신체 내(장 및 구강 등)에서 살아숨쉬는 미생물 집합인 mircobiome 을 연구하는 분야인데요, 흔히 생각하는 인간이 내재적으로 갖고있는 유전체(DNA 등, ) 외에도 우리 몸의 건강을 변화시킬 수 있는 두 번째 유전체로서, '미생물 유전체' 분야가 활발히 연구되고 있다는 사실을 처음으로 알게되어 흥미롭게 강의를 들었던 것 같습니다.

미생물 유전체는 우리의 건강 및 질병 발생에 중요한 영향을 미친다고 합니다. 예를 들어 장 내 미생물의 변화는 소화기 질환, 면역기능 저하 등과 관련될 수 있고, 따라서 microbiome 을 연구하는 것은 새로운 치료법 및 전신질환, 질병 예방 방법을 개발하는데 중요한 요소가 된다고 합니다. 

 교수님께서는 지금까지의 인간의 genome 에 대한 연구가 잘 진행될 수 있었던 이유는 reference genome 연구가 기반이 되었기때문이라고 언급하시며, 미생물 유전체에서도 reference microbiomes 가 필요하다고 말씀하셨습니다. 이 전까지의 연구는 그냥 장내 일부 미생물의 단백질을 분석해서, 어떤 단백질들이 있더라.. 라는것은 알 수 있었지만 정확히 대표적으로 어떤 species, 어떤 기능들이 질환에 연관을 주는지에 대한 연구가 없었던 것입니다.

rRNA sequencing 연구는 한 종류의 유전체를 대상으로 하기에 수천개의 장내 미생물을 분석하는데에는 한계가 명확했기 때문에, 교수님께서는 Whole metagenomic sequencing 방식, 즉 여러 개의 유전체 군집을 대상으로 one-shot, 한번에 분석하는 방식을 활용하셨습니다. WMS 는 미생물 군집의 구성원 뿐 아니라, 대규모 유전자 발굴, 대사 기능, 유전적 다양성, 생태학적 관계 등을 포함해 넓은 범위의 정보를 제공할 수 있다고 합니다.

 교수님께서는 national, 즉 인종마다도 장내 미생물의 분포나 존재가 다를 것이라 말씀하시며 미국과 중국같은 나라에 비해 한국인들의 장내 미생물에 대해 알려진바가 많지 않다며 (전체 데이터베이스의 1.43%정도) 먼저 한국인을 대상으로 한 장내 미생물 카테고리를 만들고자 하셨다고 하였습니다. 장내 미생물에는 culture 가 되는 것과, 되지 않는 난배양성 미생물이 있어 난 배양성 미생물을 culture가 되도록 만드는 조건을 찾는 것도 이 때 중요한 요소였다고 말씀을 해주셨습니다. 사용하신 WMS 기법은 다음과 같이 진행됩니다. 

 

WMS reads → (Assembly; overlab based assembly) —> contigs (하나의 gnome으로) —> (binning, 비슷한 DNA패턴을 갖고있을것이다, 양이 비슷할것이다라는 가정하에)  —> Bins (하나의 gnome이라 판단)

 

이러한 방법을 토대로 sequencing 및 classification를 하셨고, 이후 보다 발전된 read 방법인 Long read sequencing 이나 Hifi metogenomics sequencing 에 대해서도 말씀을 해주셨습니다. 이는 기존의 짧게만 read 가 되어 정확도가 낮았던 sequencing 및 binning 을, 좀 더 길게 read 할 수 있는 기법을 적용해 신뢰도를 높이고자 하던 시도였습니다 이를 통해 완벽한 gnome read 를 할 수 있었고, 나아가 TANB77 이라는 면역 반응에 효과적이라고 판단되는 unique 한 단백질을 최초 발견하셨다고 말씀해주셨습니다.

 

해당 강의에서는 다음과 같은 부분이 궁금했습니다. 먼저,  Whole metagenomic sequencing read 기법을 통해 sequencing 을 할때, Overlab을 해서 read하고 이것을 비슷한 dna 패턴을 갖고있을것이다 , 양이 비슷할 것이다 라는 가정하에 binning 을 해서, 하나의 gnome 이라고 하고 보고하여 카탈로그를 만드는데, 해당 방법으로 정말 해당 gnome 이 정확하게 sequencing 되었다고 할 수 있을까? 하는 생각이 들었습니다. 

말씀해주셨듯이 gnome 이 유사한 다른 species 가 당연히 존재할 것이고,  해당 방법은 그럴 것이다~라는 가정 하에 묶는 것이기 오류가 있을 텐데, 그럴 경우 조금만 바뀌어도 완전히 다른 gnome 이라고 인식될 것이었습니다. 이에 해당 방법으로 지금까지 쌓아온 Big data catalog 를 정말 믿을 수 있는지 궁금했습니다.

또 관련해서, WMS read 기법을 이용해서 정확하게 gnome 을 식별했다. 라고 말할 수 있는 검증 방법이 있는지 궁금했습니다? 예를 들어 조금 더 발전된 기술인 Long read sequencing 및 Hifi metagenomics sequencing, whole genome 기반 sequencing 를 통해 분석을 해서, 그 전 catalog 들의 결과들이 동일하게 나오는지, 검증한번 해봐야하지않을까? 하는 생각이 들었습니다.  

또한 얼마나 잘 alignment 되었나, 검증하는 지표로서 Read classification rate 를 보여주는 것 같은데, gnome sequencing의 실제 정답값을 우리가 모르는데 이를 어떻게 계산하는 것인지, 만일 reference gnome 카탈로그를 기반으로 계산한다고 해도.. Reference gnome 자체도 결국 동일한 분석을 통해 나온 결과인데, 이를 정답으로 삼아 계산해도 되나? 하는 생각이 들었습니다.

마지막으로는 culture 가 되는 것과 culture가 되지 않는 것의 차이가 무엇인지, 전체 장내 미생물의  80% 이상이 culture 가 안되는거라고 이야기 헤주셨는데, 장내미생물은 장 내에서 잘 살아가니까 무조건 배양이 되긴 해야할 것 같다는 생각이 들었습니다. 그리하여 사실 모든 장내미생물은 다 culture 가 되는데, 그냥 그 조건을 못찾아낸것인지, 그냥 장 내 환경이랑 동일하게 만들어주면 되지않는 것인지, 모두 동일한 환경 안에서 살아가는애들인데, 장내미생물마다 다 culture 환경이 다 다를수가 있는지, 하는 생각이 들었습니다.

실제로 질문을 드렸고 답변을 들었지만 벌써 글이 너무 길어져서 이 곳에 적지는 않도록 하겠습니다. 

처음 듣는 분야였는데 정말 쉽게 설명해주셔서 이해하기 쉬웠던 것 같습니다. 오늘도 재미있던 세미나 였습니다! 

필기 > 


Decoding our second genome for microbiome medicine 

 

인간 신체 내에서 살아 숨쉬는 미생물 집합인 마이크로바이옴을 연구하는 분야에 대한 개념을 나타냅니다.

우리가 생각하는 유전체(전체 유전 정보) 외에도, 우리는 두 번째 "미생물 유전체"를 가지고 있습니다. 이는 인간 신체 내의 미생물 집합의 유전체를 의미합니다. 이 미생물은 주로 장내 세균이지만, 바이러스, 곰팡이 등 다양한 생물학적 엔티티로 구성될 수 있습니다.

미생물 유전체는 우리의 건강과 질병 발생에 매우 중요한 영향을 미칩니다. 예를 들어, 장 내 세균 균형의 변화는 소화기 질환, 면역 기능 저하, 비만 등과 관련될 수 있습니다. 이러한 이유로, 마이크로바이옴을 연구하는 것은 새로운 치료법 및 질병 예방 방법을 개발하는 데 중요한 요소가 됩니다.

"Decoding our second genome for microbiome medicine"는 이러한 마이크로바이옴(장내/구강)의 유전체를 해독하고 이해함으로써 새로운 치료법 및 예방법을 개발하는 연구를 의미합니다. 이를 통해 우리는 개인 맞춤형 치료법을 개발하고, 신약 개발에 새로운 통로를 열 수 있습니다.

→ 전신질환 에 중요하다는 연구결과 증가중 

 

지금까지 reference genome 연구가 있었기때문에 잘 발전할 수 있었음.

마찬가지로 미생물 유전체에서도 reference microbiomes 가 필요하다. 라는 주장이 많았음.

 

그전까지 연구는 그냥 단백질만 분석을해서 어떤것들이 있더라.. 라는건 알 수 있었지만. 

정확히 대표적으로 어떤 species / 어떤 기능이 질환에 연관을 주는지에 대한 연구가 없었다. 

rRNA sequencing 연구는 불가능. —> whole metagenomic sequencing (WMS)

rRNA 시퀀싱 연구와 전체 메타젠오믹 시퀀싱(WMS) 연구는 미생물 생태학 및 다양성을 이해하는 데 사용되는 두 가지 주요한 유전체 분석 방법입니다. 이 두 방법은 다음과 같은 차이점이 있습니다:

  • 대상 유전자 또는 유전체 영역:
  • 대상의 범위:
  • 해석의 복잡성:

따라서 연구 목적 및 필요한 정보의 범위에 따라 rRNA 시퀀싱 또는 전체 메타젠오믹 시퀀싱(WMS) 방법 중 하나를 선택할 수 있습니다.



EV도 WMS 통해 해서, reference genome 을 만드는게 좋겠다. 

 

장내미생물 – 한국사람 약 1,600개.. 전체 데이터베이스의 1.43%. 

(미국/ 중국 등이 가장 많이 발견됨.)

 

#Cultured microbes -> isolated  genomes 기존의 방식

나중의 방식) 난배양성 ( culturomics -> isolated genomes) (culture가 안되는 미생물을 culture가 되도록)

1년에 100개 정도. 

장내미생물 수천개일텐데.. 장내 전체 미생물 언제 다 만드냐 너무 오래걸림. 

 

—-

WMS reads → (Assembly; overlab based assembly) —> contigs (하나의 gnome으로 어떻게?) —> (binning, 비슷한 DNA패턴을 갖고있을것이다, 양이 비슷할것이다)  —> Bins (하나의 gnome이라 생각)

 

Q. 왜 일부씩만 잘라서 하지?



Culture 를 못하는 gnome이 80% 이상.. Culture 안해도 분석가능한 방법이 필요해짐. 

 

Long read sequencing (complete cMAG with noGAP) ; 완벽한 gnome read 

 

HiFi metagenomics sequencing for cataloging cMAGS 

 

Assemble 

 

Q. 강의 잘들음. 저에게는 새로운 분야라 기본적인 내용을 여쭤보고 싶은데요,

Whole metagenomic sequencing read 기법을 통해 sequencing 을 할때, 

Overlab을 해서 read하고 이것을 비슷한 dna 패턴을 갖고있을것이다 , 양이 비슷할 것이다 라는 가정하에 binning 을 해서, 하나의 gnome 이라고 하고 보고하여 카탈로그를 한 것 같은데, 

해당 방법으로 정말 해당 gnome 이 정확하게 sequencing 되었다고 할 수 있을까? 말씀해주셨듯이 gnome 이 유사한 다른 species 가 당연히 존재할 것이고,  해당 방법은 그럴 것이다~라는 가정 하에 묶는 것이기 오류가 있을 텐데. 그럴 경우 조금만 바뀌어도 완전히 다른 gnome 이라고 인식될텐데… 해당 방법으로 지금까지 쌓아온 Big data catalog 를 정말 믿을 수 있는지 궁금하다. 

 

또 관련해서, WMS read 기법을 이용해서 정확하게 gnome 을 식별했다. 라고 말할 수 있는 검증 방법이 있나? 예를 들어 조금 더 발전된 기술인 Long read sequencing 및 Hifi metagenomics sequencing, whole genome 기반 sequencing 를 통해 분석을 해서, 그 전 catalog 들의 결과들이 동일하게 나오는지, 검증한번 해봐야하지않을까? 

얼마나 잘 alignment 되었나, 검증하는 지표로서 Read classification rate 를 보여주는 것 같은데,

 gnome sequencing의 실제 정답값을 우리가 모르는데 이를 어떻게 계산하는거지? 만일 reference gnome 카탈로그를 기반으로 계산한다고 해도.. Reference gnome 자체도 결국 동일한 분석을 통해 나온 결과인데, 이를 정답으로 삼아 계산해도 되나? 하는 생각이 든다. 






—--------------

카탈로그도 여러 종류인 것 같은데 카탈로그별로도 다 .. 다른거면.. 

 

Gnome 이 유사한 다른 species 가 존재한다. Whole genome 기반으로 프로파일링 해야한다.. 



전체를 한번에 이미징해야하는 방법밖에없나? 

 

Q. marker-based VS DNA-based .. 

 

TANB77 

 

Culture → 쥐에 주입 → control 과 비교 

But TANB 는 culture가 안됨. → 

 

Q2.culture 가 되는 것과 culture가 되지 않는 것의 차이는 뭐지?  80% 이상이 culture 가 안되는거라고 이야기 헤주셨는데, 장내미생물은 장 내에서 잘 살아가니까 무조건 배양이 되긴 해야할 것 같은데.. 사실 모든 장내미생물은 다 culture 가 되는데, 그냥 그 조건을 못찾아낸건가? 그냥 장 내 환경이랑 동일하게 만들어주면 되지않나..? 

다 동일한 환경 안에서 살아가는애들인데, 장내미생물마다 다 culture 환경이 다 다를수가 있나??