화학공학소재연구정보센터
학회 한국화학공학회
학술대회 2001년 가을 (10/19 ~ 10/20, 한밭대학교)
권호 7권 2호, p.2949
발표분야 공정시스템
제목 단백질 보존 지역간의 연관성 탐사
초록 바이오정보학(bioinformatics)은 생물학 분야 특히 분자 수준의 유전체 연구에서 발생하는 데이터를 저장, 관리, 분석하여 실험 프로젝트를 지원함은 물론, 기능 예측 및 제어에 대한 실험 설계를 가능하게 하는 제반 컴퓨터 기술을 의미한다. 현재, 인간 유전체 프로젝트(Human Genome Project)를 통하여 유전자의 서열 정보가 밝혀짐에 따라, 유전체 연구의 주된 방향이 다양한 유전자에 대한 기능을 분석하고자 하는 측면으로 시작하고 있다. 유전체 연구의 다양한 접근 방식 중 단백체학은 유전체의 최종 산물인 단백질을 직접적으로 다룬다는 측면에서 그 효용성에 대해 많은 기대를 모으고 있다. 본 논문에서는 데이터 마이닝 에서 연구된 연관 규칙 탐사 기법을 이용하여 단백질의 기능 분석 문제에 이를 응용하고자 한다. 즉 단백질의 일차 구조인 아미노산 서열에 나타나는 부서열간의 연관성이 해당 단백질의 이차 혹은 삼차 구조를 결정하는 중요한 단서임을 설명하고, 아미노산 부서열간의 연관성을 표현하기 위한 모델로서 서열 연관 규칙을 정의한다. 서열 연관 규칙의 유용성을 평가하기 위한 지지도와 신뢰도를 새롭게 정의하고, 주어진 단백질 집단으로부터 유용한 서열 연관 규칙을 발견하기 위한 기법을 제안한다. 생물 현장에서 쓰이고 있는 서열의 유사성이나 한 개 이상의 모티프를 비교 검색해주는 기존의 도구와는 달리 제안하는 알고리즘은 주어진 서열에서 여러 패턴을 발견하고, 이들 패턴들끼리의 연관성을 사용자가 요구하는 지지도와 신뢰도 계수를 이용하여 타당성 있게 검증해준다. 본 연구의 결과는 탐사된 규칙으로부터 다른 단백질의 구조와 기능을 예측할 수 있고, 이 정보는 필요로 하는 생물학적 분석을 방향을 제시할 것이다. 이는 생물학적 실험 대상의 후보조합을 최소화함으로써 많은 시간과 노력 비용을 절감할 수 있다.
저자 이도헌, 김정자
소속 전남대
키워드 Bioinformatics; Functional Genomics; Proteomics; Association Rule; Protein
E-Mail ,
VOD VOD 보기
원문파일 초록 보기