초록 |
물성의 온라인 측정에 대한 필요성은 공정 제어의 목적에서나 또는 생산물에 대한 품질 감시 측면에서 크게 대두되고 있다. 온라인 측정이 실현되면 취할 수 있는 제어 동작의 범위가 그만큼 넓어지고 실시간 품질 감시가 가능해지기 때문이다. 측정이 용이하지 않은 물성을 온라인으로 측정할 수 있는 수단으로 스펙트럼에 대한 calibration을 들 수 있다. Calibration 알고리즘에는 고전적인 회귀 분석(classical regression), PCR (Principal component regression), PLS(Partial Least Squares)등이 있는데, 스펙트럼 데이터의 경우처럼 상관 관계를 가지는 독립 변수(predictor variable)의 수가 대단히 많고 예측하고자 하는 변수(response variable)의 수가 하나인 경우에는 PLS 알고리즘이 적합하다. 본 논문에서는 원유의 NIR 스펙트럼과 PLS 알고리즘을 결합시킴으로써 원유의 API값에 대한 예측 모델을 구성하였으며, 데이터 전처리와 변수에 대한 선택 및 변환(transformation)을 통해 예측기 성능의 향상을 모색하였다. 먼저, 데이터에 대한 사전 처리를 하지 않고 예측 모델을 구성해 보고, 특이점(oulier) 제거, 독립 변수 선별, wavelet transform을 차례로 취하면서 예측 모델을 개선해 나갔다. 특이점의 제외, 변수 선별, wavelet transform 모두 예측 모델의 성능을 높이는 데에 기여했는데, 특히 변수의 선별이 가장 큰 효과를 나타내었다. 특이점은 hierarchical cluster analysis를 통해 발견하였고, 원유의 조성을 고려하여 의미있는 파장들을 선별해 내었다. 스펙트럼에 wavelet transform을 취하여 회귀분석을 하는 wavelet regression 경우, thresholding을 주는 상황에서만 예측 성능의 향상이 이루어졌다. Thresholding을 주지 않은 경우에는 변환을 취하지 않았을 때와 동일한 결과를 보여 주었는데, 스펙트럼이 가진 정보가 파장-스케일 영역에서도 그대로 보존됨을 의미하며 thresholding을 통한 노이즈 제거 효과와 변수에 대한 재선별 효과가 예측 모델의 성능을 향상시켰다고 해석할 수 있다. 요컨대, outlier의 제거, 중요 변수에 대한 선별을 통해 경험 모델이 갖는 예측 성능을 크게 향상시킬 수 있고, wavelet thresholding으로 노이즈 제거 및 간접적인 변수 재선정 효과를 거둠으로써 예측 성능의 극대화를 이룰 수 있다.
|