理學산책

[스크랩] 시스템생물학 연구 동향 리포트

kongbak 2012. 1. 16. 22:27

                          농촌진흥청 국립농업과학원 농업생명자원부에서는 생명공학과 관련된 최신연구동향 정보를 관심있는

                          여러분들과 공유하고자 합니다.                         

 

                          * 자료 출처 : http://www.biochem.or.kr/sub/popup_letter.php?CatNo=686

 

시스템생물학은 인간 게놈 프로젝트 이후에 각광받고 있는 생물학의 한 분야이다. 시스템생물학이란 개념은 이미 오래 전부터 존재해왔지만 시스템의 구성인자에 관한 정보획득 과정의 어려움 때문에 시스템 생물학을 본격적으로 추구하게 된 것은 21세기에 시작되었다. 현재에는 DNA 이중나선의 발견 이후 급속히 발달한 분자생물학적 지식을 기반으로 여러 유전체의 서열이 속속 완성되고 있고 오믹스로 표현되는 데이터들의 여러 측면에서의 독립적 대량-발굴 (high-throughput, HT)로 인해 그 축적된 데이터가 기존의 생물학에서 행해졌던 단편적인 이해를 뛰어넘어 시스템적 맥락에서 생명현상을 이해하고자 하는 시스템생물학의 발전을 촉진시켰다. 이미 시스템생물학이 상대적으로 단순한 시스템인 미생물을 대상으로 구성 요소의 동정 단계를 넘어 새로운 유전자 회로의 설계와 변경과 같은 합성 생물학 (synthetic biology)에 이르는 성과를 거두었고 최근에는 포유류를 대상으로 한 시스템생물학도 비록 그 생명현상의 복잡성 때문에 발전이 늦긴 하지만 보다 효과적인 치료제 개발의 가능성을 염두에 두고 본격적으로 연구들이 진행되고 있다. 시스템생물학은 각종 high-throughput (HT) 오믹스 데이터의 분석과 정보학을 이용한 수학적 모델링을 주된 기법으로 사용한다. 여러 계층의 오믹스 데이터 (예: genomics, transcriptiomics, proteomics, metabolomics)를 생산, 축적하고 이를 종합적으로 분석함으로써 생체 내 전반적인 생명현상을 파악하는 것이 시스템 생물학적 접근법이다 (그림1 참조). 최근에는 여러 선진국을 중심으로 시스템생물학 연구를 위해 필요한 여러 계층의 오믹스 데이터 생산과 분석을 한곳에서 집중적으로 할 수 있는 센터들이 생겨나 기술집약적인 시스템생물학 연구가 활발히 이루어 지고 있다. 대표적인 예로서 미국 시애틀에 위치한 시스템생물학연구소 (Institute for ?Systems Biology, ISB)는 다양한 계층의 오믹스 연구를 위한 최신 설비를 갖추고 있으며, 또한 다양한 전공의 사람들이 모여 시스템생물학을 연구하고 있다.
그림1. 시스템생물학 개요
(출처: An overview of cardiac systems biology by Shreenivasaiah PK, Rho SH, Kim T, Kim D H., J Mol Cell Cardiol. 2008)

1. 오믹스 데이터

Genomics 분야에서의 생물학 연구는 유전자 발현 양상을 여러 자극상태, 혹은 질병상태와 정상상태를 대상으로 한 비교분석을 통해 이루어졌다. 다양한 형태의 microarray 분석 기술을 이용한 genomics 분석은 대용량의 데이터를 양산 하였고 이는 시스템생물학적 접근의 기반을 조성하였다.
현재 microarray기술이 발전함에 따라 많은 생물학자들이 이를 이용한 실험을 진행하고 있고, 몇몇 발표된 실험데이터는 공개되어 GEO database를 통해 제공되고 있다. Genomics의 연구를 통한 발현 유전자의 분석은 매우 다양한 생물학적 정보를 제공하여 주었지만 생명시스템의 변화를 가장 잘 반영할 수 있는 단백질 수준의 정보, 즉 단백질의 발현 양상과 단백질이 어떤 수정 (modification) 과정을 거치는지에 대한 정보는 유전체 연구를 통해서만은 알 수가 없다. 전체적인 생명 시스템에 대한 이해를 위해서는 유전체학 실험 방법과 더불어 단백질체학 등의 다양한 오믹스 연구가 필요하다. 단백질체 분석을 위한 다양한 실험기법이 사용되고 있으며 이러한 단백질체에 대한 분석 방법은 최근의 여러 리뷰 논문에서 소개되고 있다 (2,3,4). 유전체학, 단백질체학과 더불어 대사체에 대한 정보 분석도 매우 중요한 분야 중 하나로 떠올랐다. Griffin의 2004년 논문에는 NMR을 이용한 대사체 연구가 기술되어 있다 (5). 이와 같이 다양한 생명현상 분석을 위한 다양한 오믹스 정보들이 얻어지고 있고 이를 분석하기 위한 시스템생물학적 방법이 활발히 수행되고 있다.

2. 오믹스 데이터의 생산

일반적으로 오믹스로 언급되고 있는 생물학적 기법은 생물학적 데이터를 대량으로 생산하는 것을 목적으로 두고 있는 실험기법들을 통칭하는 것으로서 1995년 Haemophilus influenzae의 게놈이 완전이 해독된 이래로 끊임없이 개발 및 개선 되어 왔다 (6). 생물학 연구는 다양한 학문의 여러 기술들이 도입되어 매우 빠르게 발전했다.

Microarray

Microarray의 개념은 1980년에서 1990년대에 정착되어 개발되기 시작한 기술로서, 시작은 나일론 membrane에 자란 cosmid library의 bacterial colony를 2mm 간격으로 키워 hybridaization한 것이다. 당시에는 전체 염기 서열 정보를 알 수 없었기에 library 전체를 사용하여 probe DNA와 hybridization하는 colony를 선택하는 일종의 screening 방법이었다. 최근에는 기술의 발달로 기존에 비해 chip에 매우 고밀도로 probe를 spotting할 수가 있게 되었다. (7).

그림 2. 동일한 면적에 사용된 spot수 비교 4 spots→169 spots→22,500 spots
<출처: 생물학 연구 정보센터 Biowave <http://bric.postech.ac.kr/webzine. vol.8 No.3>

이러한 microarray기술의 급격한 발전은 대용량의 데이터를 빠르게 얻을 수 있게 함으로써 시스템생물학 발전에 큰 진전을 가져왔다.
Microarrays는 probe의 특성에 따라 cDNA microarray와 oligonucleotide microarray로 구분된다. 최근에는 여러 다양한 회사 (Affymetrix, illumina, Agilent 등)에서 oligonucleotide를 이용한 microarray chip이 나와서 매우 편리하게 대용량의 data를 얻을 수 있다. 다양한 종에 대한 genome이 분석된 최근 microarray의 경향은 상업적으로 판매되는 oligonuclotide microarray를 이용한 실험이 수행되고 있다. genome 기술의 발달과 더불어 전체 염기서열 정보가 알려진 생물 종의 경우 많은 상업적 생명공학 회사 (Affymetrix, illumina, Agilent 등)에서 microarray chip을 시판하였다. 그 중 whole genome microarray는 4만개 이상의 probe를 가지고 있어 한번의 실험을 통해 대량의 유전자 발현 양을 검증할 수 있다. 현재 많은 회사를 통하여 다양한 형태의 microarray chip이 존재하며, 다양한 chip에 대한 정확성과 재현성 검증을 위한 MAQC project가 여러 그룹에 의해 수행되어 발표 됨으로써 사용자들의microarray chip의 선택을 도와주고 있다 (8). 현재 국내에서는 다양한 회사 (Affymetrix, illumina, Agilent등)와 다양한 형태 (miRNA, gene expression!, ChiP등)의 microarray기법들이 도입되어 사용되고 있다.

Deep sequencer

보다 정확한 유전자의 발현 정보를 얻기 위한 노력은 계속 되어 왔다. 최근 microarray 기술의 발전이 가속화 되어 정확도와 재현성이 크게 향상 되었지만, 적은 수준의 발현양을 보이는 유전자에 대한 발현 양상 분석에 있어서는 좀더 정확한 분석 방법이 필요하다고 생각되고 있다. Deep sequencing 기술은 새롭게 개발된 염기서열 분석기술로서 기존의 염기서열 분석기계보다 염기서열 분석능력에 있어서 훨씬 강력한 성능을 가지고 있는 분석기기이다. 이러한 Deep sequencing 기술 중 하나로 illumina사의 Solexa genome analyzer는 한번에 분석할 수 있는 염기서열이 1.5 gigabase로서 매우 크다. 본래의 목적은 대용량의 서열분석이지만, 분석용량이 커서 이를 이용하여 다양한 유전체 분석에 응용되고 있다. Solexa genome analyzer를 이용할 수 있는 분야에는 단순 서열 분석, Chromatin immunoprecipitation을 수행한 후 회수된 모든 DNA 조각을 한꺼번에 sequencing하는 ChIPSeq, Small RNA 분석, gene expression! 분석 등이 있다. (9).
Deep sequencer를 이용한 유전체 분석방법이 Microarray와 차별되는 가장 큰 특징은 유전자의 서열을 분석하는 기술이므로 탐침자 서열을 알지 못하는 유전자도 분석할 수 있고 새로운 유전자의 동정이나 기존에 알려지지 않은 smallRNA 발현 분석 등의 실험도 수행할 수 있다.

 
그림 3. Solexa genome analyzer 원리
<출처. Illumina 홈페이지>

단백질분석

단백질체학은 생명체내에서 실질적으로 작용하는 단백질에 대한 대규모 동정을 목적으로 한다. 단백질체학에서는 단백질의 발현수준뿐만 아니라 단백질의 인산화 등의 변형, 다른 단백질과의 상호작용, 단백질의 위치들을 연구한다. 단백질체학에서 가장 많이 사용되는 방법은 mass spectrometry (MS)를 이용한 단백질 분석이다. MS를 이용함으로써 단백질 발현 정보와 변형 등의 정보를 대량으로 얻을 수 있다. Liquid chromatography MS와 MALDI MS는 트립신과 같은 단백질 분해 효소를 이용하여 단백질을 잘게 자른 후 이를 이온화 시킨 다음 질량분석기로 분석하는 기술이다. 한번에 수천 개의 펩타이드 정보를 얻게 됨으로써 빠르게 단백질을 분석할 수 있는 방법이다. 2003년에는 FT-ICR이라는 고기능 분석기를 결합한 기기가 개발되어 기존의 MS에 의해 분석되었던 정보보다 더욱 정확하고 많은 정보를 얻을 수 있게 되었다 (3).
단백질체학에서는 MS를 이용한 단백질 분석뿐만 아니라 microarray에 사용된 array기술을 단백질체학에 도입하고자 하는 노력이 계속 되고 있다. 단백질 microarray는 probe로서 단백질, 펩타이드, 항체, 항원, 탄수화물, 소분자 등의 상보적 결합물질을 표면에 붙여서 사용하며, mRNA microarray처럼 발현분석 등에 사용하고 있다. 하지만 아직까지 기술적 한계로 인해 집적도가 낮다 (3).

3. 오믹스 데이터 분석

다양한 기술을 이용한 대용량의 오믹스 데이터 생산은 복잡한 생명현상 이해를 위한 기반을 제공하였다. 하지만 단순 데이터 나열로서 어떠한 생명현상에 대해 시스템적으로 이해한다는 것은 불가능하다. 생명현상을 이해하기 위해서는 각각의 구성요소에 대한 정보와 더불어 다양한 방법을 이용한 데이터의 통합이 필요하다. 오믹스 데이터 통합에 대한 설명은 Joyce와 Palsson에 의해 2006년도에 발표된 리뷰논문에 잘 정리 되어 있다.
많은 연구자들에 의해 대량으로 생성된 많은 생물학적 데이터들은 여러 다양한 공용 데이터베이스에 축적되고 있으며 누구나 정보에 접근하여 사용할 수 있도록 공유되어 있다. 매우 간편하게 web을 이용해 접속하여 쉽게 이미 생성된 다양한 생물학적 데이터를 얻을 수 있다. 지금 이순간에도 많은 수의 데이터베이스가 만들어지고 배포되는데, 그 중에서 대표적인 데이터베이스를 나열하면 NCBI (National Center for Biotechnology Information)에서 제공하는 다양한 데이터베이스, 최신 유전자 genome 데이터를 제공하는 UCSC 데이터베이스, 유전자의 ontology 정보를 제공하는 GO (Gene Ontology) 데이터 베이스, 신호전달 체계에 대한 정보를 제공하는 KEGG, 인간의 다양한 오믹스 정보를 제공하는 GeneCards 등을 들 수가 있다. 최근 들어 전체적인 정보를 제공하는 통합 데이터 베이스와는 별도로 한 분야로 특화된 데이터베이스의 개발도 이루어 지고 있다. 하나의 예로서 2006년에 공개된 HCNet은 NCBI의 GEO 데이터베이스 정보를 이용하여 심장관련 유전자의 기능적 모듈을 분석하여 사용자에서 보여주는 특화된 데이터베이스이다 (11). 이와 더불어 CIDMS(cardiac integrated data management system)은 새롭게 개발되고 있는 심장에 특화된 데이터 베이스로서 심장에서 발현되는 모든 유전자에 관한 정보 및 high-throughput 실험을 통해 얻어진 여러 계층의 오믹스 정보뿐만 아니라 이미 개발된 모든 수학적 모델에 관한 정보를 제공하는 데이터 베이스이다 (Http://www.cidms.org).

 

4. 시스템생물학 연구 개발 동향

국내연구 개발 동향

국내에서는 2002년도에 시스템생물학 연구회 구성으로 그룹화, 상호연계연구, 연구 대상 생체시스템의 체계적인 선정 등이 이루어지기 시작하였으며 (한국 시스템 생물학 연구회 발족, 2002. 10), 2003 년에는 국내 최초로 시스템생물학 국제심포지움이 개최되었다 (Seoul Symposium on Systems Biology 2003, 서울대 문화관, 2003. 4). 최근 들어 한국생화학분자생물학회, 한국분자세포생물학회, 한국생물과학협회, 대한생화학분자생물학회, 한국유전체학회 등 대부분의 국내 저명 학회에서는 시스템생물학 심포지움을 정기학술대회의 주요 프로그램으로 채택하고 있다. 또한 과학재단에서는 최근 학연산성과교류회를 시스템생물학을 주제로 하여 개최한 바 있다 (2007. 11. 2, GIST).
과학기술부 특정연구개발사업으로 진핵세포 시스템생물학 연구 과제인 "칼슘대사 시스템생물학연구" (연구책임자: GIST 김도한) 및 원핵세포 시스템생물학 과제인 "미생물 가상세포 연구 (연구책임자: KAIST 이상엽)" 가 선정되어 현재 3단계 사업이 (2007년 4월 ~ 2010년 3월) 진행 중이다. 이러한 연구 과제를 통해 칼슘대사에 관여하는 신규인자의 발굴 및 상호작용 예측, 형질전환을 통한 주요 칼슘대사인자 네트워크 규명 및 신호 경로의 수학적 모델링, 미생물 대사 회로의 정성적, 정량적 분석, 시스템 재설계 기술 및 가상세포 시스템 개발 등 주요 시스템 생물학의 기반 기술들이 확립되고 있다. 생물정보학, 분자 이미징, 바이오 컴퓨팅, 제어 공학 등 시스템생물학을 위한 관련 기술들의 국내 역량은 빠르게 향상되어 가고 있다.

 

출처 : 국립농업과학원
글쓴이 : 국립농업과학원 원글보기
메모 :