[논문 리뷰 스터디] Optimal false alarm controlled support vector data description formultivariate process monitoring
작성자: 17기 우윤규
https://www.sciencedirect.com/science/article/pii/S0959152417302020
Optimal false alarm controlled support vector data description for multivariate process monitoring
One-class classification plays a key role in the detection of outliers and abnormalities. Recently, several attempts have been made to extend the appl…
www.sciencedirect.com
통계적 공정관리 (SPC)는 품질 관리를 위해 가장 널리 사용되는 방법 중 하나입니다.. SPC의 기본 목표는 품질 열화 및 불량품 생산으로 이어질 수 있는 프로세스의 비정상적인 변화를 신속하게 감지하는 것입니다.
본 논문에서는 다변량 데이터셋에서 이상 탐지(anomaly detection)를 수행하는 방법으로, "Optimal false alarm controlled support vector data description"을 제안합니다. 이 방법은 (SVM)을 이용하여 정상 동작(normal behavior)의 모델을 만들고, 해당 모델을 사용하여 비정상 동작(abnormal behavior)을 탐지하는 방법입니다. 이 때, SVM의 매개변수를 조절함으로써 거짓 경보(False alarm)의 비율을 조절할 수 있습니다. 이 방법은 다변량 데이터셋에 적용되며, 실제 데이터를 이용한 실험에서 다른 이상 탐지 방법보다 더 높은 성능을 보였습니다.
논문에서 제안하는 "Optimal false alarm controlled support vector data description" 방법은 다음과 같은 주요 알고리즘으로 구성됩니다.
1. 정상 동작 데이터의 모델링: 정상 동작 데이터셋을 이용하여 SVM을 이용한 데이터 모델링을 수행합니다. 이 때, SVM에서 사용되는 하이퍼파라미터는 모델의 거짓 경보(False alarm) 비율을 조절하기 위해 반복적인 실험을 통해 조정됩니다.
해당 식을 Primal 문제가 아닌 Dual 관점에서 보고 Kernel 함수를 사용한다면 다음과 같이 변형이 가능합니다.
2. 비정상 동작 탐지: 모델링된 SVM을 이용하여 정상 동작과 비정상 동작을 구분하는 이상 탐지를 수행합니다. 이상 탐지에서 거짓 경보 비율을 조절하기 위해서는 SVM 모델의 결정 경계(decision boundary)와 SVM 모델과 데이터의 거리(distance)를 이용하여 거짓 경보를 제어합니다.
3. 거짓 경보 비율 조절: SVM 모델의 거짓 경보 비율을 조절하기 위해 SVM의 하이퍼파라미터를 조정합니다. 이 때, 거짓 경보 비율은 실험을 통해 결정됩니다. 이 방법은 SVM을 이용하여 데이터셋을 모델링하고, 거짓 경보 비율을 조절하여 비정상 동작을 탐지하는 방법입니다. 논문에서는 다양한 실험을 통해 이 방법이 다른 이상 탐지 방법보다 높은 성능을 보인다는 것을 증명하였습니다.
<본래 SVDD 만을 사용하여 만든 관리도>
본 논문에서 제시한 OSVDD를 사용하였을 때의 관리도에서 좀더 이상치를 민감하게, 그리고 이상치와 이상치가 아닌 것 간의 간격을 좀 더 크게 나누고 있는 모습을 확인할 수 있다.
유의 수준 Alpha값에 따라서 다음과 같이 그려질 수 있습니다.
최종적으로 이상치 판별이 완료되면, 모델을 학습한 데이터에 대해 정상 동작을 확인하고, 이상치를 제외한 데이터를 이용하여 제어 경계를 다시 학습합니다. 이렇게 제어 경계를 다시 학습함으로써, 실제 공정에서 발생할 수 있는 다양한 이상치 상황에 대응할 수 있습니다.
댓글 영역