화학공학소재연구정보센터
학회 한국화학공학회
학술대회 2002년 봄 (04/26 ~ 04/27, 강원대학교)
권호 8권 1호, p.1173
발표분야 생물화공
제목 군집화분석을 이용한 DNA microarray data분석
초록 DNA chip technology의 급속한 발전으로 인해 biological research paradigm이 data acquisition에서
data analysis로 변화하고 있다. 수천 개에서 수 만개까지의 correlated 된 gene의 expression profile data는 은 매우 복잡해서 systematic 한 data 분석 방법이 요구되고 있다. 현재 hierarchical clustering 방법이 가장 많이 사용되지만 몇 가지 문제가 있다.
첫째로, 한번 특정 cluster라고 할당된 gene은 잘못 할당이 되었다 하더라도 다시 할당되지 않는다.
두 번째, 새로운 cluster로 군집화 되기보다는 기존의 cluster로 군집화 되는 chaining, linking effect 가 생기기 쉽다.
셋째, complete-linkage, single-linkage method의 경우 noise, outlier에 영향을 크게 받는다.
넷째, 정확한 cluster boundary를 정하기가 쉽지 않다.
이러한 문제점들을 극복하기 위해서 우리는 hierarchical clustering method와 k-means clustering method를 합친 hybrid clustering method를 제안한다. 제안한 방법을 yeast data에 적용한 결과 hierarchical clustering method 보다 더 homeogenous한 clustering이 되었다. 또한 제안한 방법은 yeast 뿐만 아니라 다른 여러 organism의 gene expression profile data analysis 에도 이용 될 수가 있다.
저자 권성우, 한종훈.
소속 포항공대 화학공학과
키워드 bioinformatics; DNA chip; data analysis.
E-Mail
원문파일 초록 보기