초록 |
최근 들어 국내외에서 유전체 자료(genomic data)에 관한 많은 연구가 집중적으로 이루어지고 있다. 특히 DNA microarray 기술은 수천 개의 유전자에 대한 발현양상을 동시에 관찰한 것으로 유전자의 regulation과 interaction의 이해를 돕는데 큰 기여를 할 뿐 아니라, 제약이나 임상연구에서도 매우 중요한 응용을 할 수 있다 (Eisen et al, 1998; Golub et al, 1999). 그러나 이러한 microarray data는 실험계획이나 image processing, 판별분석 등에 이르는 다양한 과정에 걸쳐 수많은 통계적 문제점들을 안고 있게 된다 (그림 1 참조). 이는 본질적으로 대규모 관측에 따른 위양성(false-positive) 발견 수의 증가와 여러 개 array slide의 동시 실험에 따른 고차원 통계량 분석의 어려움에서 기인한다(Weinstein, 1998). 인간유전체 기능연구가 성공적으로 수행되기 위해서는 이러한 data processing 및 data analysis 과정이 올바르게 제어되어야 한다. 이 가운데에서 유전체자료의 품질관리를 위한 방법으로 표준화방법 및 생명정보학적 발견에 대한 통계적 평가방법, 유전체자료분석에서의 클러스터링 방법에 관한 연구를 논의하겠다. |