화학공학소재연구정보센터
학회 한국화학공학회
학술대회 2002년 가을 (10/24 ~ 10/26, 서울대학교)
권호 8권 2호, p.2853
발표분야 공정시스템
제목 다변량 통계 기법을 이용한 DNA microarray 자료 분석
초록 본 연구에서는 DNA microarray를 이용한 암 진단에 주로 사용하는 전처리 방법인 PCA의 문제점을 해결하는 방법으로, DNA microarray 데이터를 PCA로 전 처리하고 주성분들 중에서 암 진단에 중요한 의미를 가지는 주성분을 SDA(stepwise discriminant analysis)를 통하여 선별하고 선별된 주성분의 주성분 점수 값(score)으로 암 분류 모델을 만들고 이를 검증하도록 하는 방법을 제안한다. 한편 제안하는 방법과 비교하기 위하여 DNA microarray 데이터를 PCA로 전 처리하여 유전자의 발현 양상을 잘 설명하는 주성분을 가지고 암을 진단하는 방법과 결과를 비교 한다. 그 결과 원래 많이 사용되는 분류 방법인 neural network와 K-NN에서 보다 정확히 암을 진단하며 한 가지 특정 암 데이터뿐만 아니라 여러 가지 종류의 암에도 정확한 진단을 한다. 그리고 분류하고자 하는 암 종류가 두 가지 일 때뿐만 아니라 여러 가지 종류로 분류해야 하는 경우도 제안하는 방법이 PCA만으로 전처리 하는 것보다 정확한 진단을 하며 breast cancer 데이터의 경우 Khan et al.,이 제안한 방법을 사용하면 overfitting이 되며, 높은 오분류율 값을 가진다. 그러나 본 연구에서 제안하는 방법은 적은 수의 중요한 주성분만을 가지고 암 진단 모델을 만들기 때문에 overfitting 되지 않고 검증 표본의 오분류율도 적었다. 더욱이 제안하는 방법은 Laura J et al.,이 만든 암 전이 진단 모델보다 더 정확하다.
저자 권성우, 한종훈
소속 포항공대 화학공학과
키워드 Bioinformatics; DNA microarray; cancer classification
E-Mail
VOD VOD 보기
원문파일 초록 보기