Bioinformatics (BI)

1. Bioinformatics 정의 및 가치

생명정보과학으로 컴퓨터를 구사해 방대한 생물 정보를 효율성 있게 정리·해석하고 그 생물학적·의학적인 의미를 밝히는 학문으로 유전자 지도 분석과 맞물려 차세대 첨단산업으로 떠오르는 업종이다. 20세기 말에 ‘생명의 설계도’라고 불리는 사람의 게놈(인간의 모든 유전 정보)이 거의 밝혀졌지만 이것은 게놈을 구성하는 30억 유전암호문자(염기) 데이터를 손에 넣은 것뿐이고, 그 암호를 해독하지 않으면 게놈이 무엇을 의미하는 것인가는 보이지 않는다. 21세기가 생명 과학의 시대라고 불리는 이유는 유전 암호의 바다에 감추어진 유익한 정보를 찾아내면 꿈의 신약과 치료법 등의 개발이 실현될 수 있기 때문이다. 이 때문에 국내외에서 포스트 게놈 연구 경쟁이 본격화하고 있다. 포스트 게놈 연구에서 단백질의 구조 결정과 기능 추정, 단백질 간의 상호작용 해명에 필수적인 학문이 생물학과 정보 기술(IT)이 융합한 새로운 과학기술인 바이오인포메틱스이다.

Next-Generation Sequencing (NGS)뿐만 아니라 통합적인 Genomics Analysis와 Bioinformatics Technologies는 약학과 현대 생물학의 융합의 선두에 있으며, medical biology를 과학에 기반을 둔 systems biology로 변화시키고 있다. 이는 유전자의 수준에서 병리 원인의 진단과 체계적인 설명이 가능하도록 만든다. 또한 세포 내부와 분자 수준에서 치료 타겟의 판별이 가능하게 한다.

특히, 점점 늘어나고 있는 거대한 NGS, Copy Number Aberration, Genomic DNA Methylation, Histone Modification ChIP-Seq data는 종양 유전체학에 혁신을 일으키고 있다. 이는 종양 유발 돌연변이, 발암의 예측, tumor clonal evolution, personal cancer medicine을 위한 다양한 약물의 최적 조합에서 높은 정확도의 bioinformatics 분석을 가능하게 한다.

2. 현재 실험실에서 수행중인 바이오 인포메틱스 탐색 연구

2-1) scRNA-seq 데이터를 포함한 다양한 데이터를 활용하여 바이오마커 연구 및 새로운 발견을 위한 연구

 SCLC는 임상이 많이 진행되고 있으나 현재 first line therapy로는 Chemotherapy와 anti-PD-L1만 사용되고 있는 상황이다.  따라서, 정상 폐조직에서는 적게 발현하고 SCLC에서는 많이 발현하는 유전자를 찾아 off-tumor effect를 줄이고 암 특이적인 새로운 치료 target을 제시하고자 Macine learning, Deep learning 기법을 적용하여 가장 유의미한 bi-specific antibody target을 찾고자 연구를 진행 중이다.

2-2) Cell Subtype규명-Profiling Fibroblasts in Colorectal Disease

   대장 질환은 대장암 (Colorectal Cancer) 과 염증성 장질환 (IBD, Inflammatory Bowel Disease) 등을 포함하여 중요한 역할을 하는 것 중 하나가 섬유아세포이나 이에 대한 연구는 여러가지 어려움이 존재하므로  Subtypes을 정확하고 일관되게 정의해야 하는데 이에 대한 합의가 아직 부족하다. 또한 정상적인 대장 조직에서 질병이 있는 조직으로 변화하는 과정에서 섬유아세포가 겪는 특정 표현형 및 기능적 변화에 대한 지식도 부족한 것이 현실이다.   따라서 본 연구팀에서는 기존의 문제점을 극복하면서 새로운 섬유아세포의 subtypes을 규명하고자 연구하고 있다.