A Next-Generation Sequence Clustering Method for E. coli through  Proteomics-Genomics Data Mapping
Mikang Sim, Ho-Sik Seok, Jaebum  Kim*
a Department of Animal Biotechnology, Konkuk University, Seoul  143-701, Korea
bUBITA Center for Biotechnology Research (CBRU), Konkuk  University, Seoul 143-701, Korea
Recent publications of various ‘omics’ data have provided new challenges and  opportunities to the development of novel approaches to the assembly of next-generation sequences. As an attempt to improve the quality of assembled  sequences, we developed a next-generation sequence clustering method by using  the interdependency between genomics and proteomics data, which has not been  well utilized so far in this field. Given a set of next-generation read  sequences with a number of protein sequences, our method clusters the read  sequences by mapping to the protein sequences. As a preliminary research, we  selected Escherichia coli (E. coli) as our target species and simulated  next-generation reads of E. coli to evaluate our method by analyzing the  actual adjacency of the clustered reads in the E. coli genome. We found that (i)  read base matching (RBM) ratio, which represents the amount of bases in a  read that are mapped to a protein sequence, higher than 50~70% is a useful  criterion for effective read clustering and (ii) higher RBM ratio does not always lead to better quality of clusters in the case of E. coli. These  preliminary results demonstrate that the integrative approach is simple yet has great potential for  clustering adjacent reads in a genome.
 
 
Picture
복원된 조상 유전체를 이용한 진화적 절단점 확인 기법
염기서열 분석 기술의 발달로 현존 생물종의 공통 조상을 염색체 수준까지 재구성하는 연구들이 진행되고 있다. 공통 조상 유전체 복원에는  진화 과정에서 발생한 사건의 결과인 진화적 절단점이 중요한 역할을 담당한다. 본 논문에서는 현존하는 포유류 중 13종의 유전체 데이터로부터 복원된 조상 유전체 정보를 이용해서 13종의 진화 계통수를 뉴윅-트리 형태로 입력받아 포유류의  공통조상(Boreoeutheria)과 그 하위의 모든 노드에 존재하는 진화적 절단점을 찾는 기법을 개발했다. 이 기법을 사용하여 얻은  진화적 절단점은 말단 노드 중 하나인 소에서 120개로 가장 많이 발견되었고, 인간 말단 노드와 인간과 침팬지의 중간조상 노드에서는  하나도 발견되지 않았으며, 노드마다 다양한 수의 진화적 절단점을 가진 것을 확인하였다. 본 논문에서 밝힌 진화적 절단점은 해당 지점에서  발생한 진화적 사건을 추측할 수 있는 근거로 활용할 수 있을 것이다.