Journal of the Korean Institute of Industrial Engineers
[ Article ]
Journal of the Korean Institute of Industrial Engineers - Vol. 48, No. 4, pp.367-375
ISSN: 1225-0988 (Print) 2234-6457 (Online)
Print publication date 15 Aug 2022
Received 16 Feb 2022 Revised 10 May 2022 Accepted 23 May 2022
DOI: https://doi.org/10.7232/JKIIE.2022.48.4.367

기계 건강 지표 구축을 위한 재구성 기반 이상 탐지

송승환 ; 황우영 ; 이유진 ; 백준걸
고려대학교 산업경영공학과
Reconstruction-based Anomaly Detection for Health Indicator Construction of Machinery
Seunghwan Song ; Woo Young Hwang ; Yujin Lee ; Jun-Geol Baek
Department of Industrial and Management Engineering, Korea University

Correspondence to: 백준걸 교수, 02841 서울특별시 성북구 안암로 145 고려대학교 산업경영공학과, Tel : 02-3290-3396, Fax : 02-3290-4550, E-mail : jungeol@korea.ac.kr

© 2022 KIIE

Abstract

In the manufacturing process, maintenance is performed at a specific time point based on continuous monitoring of equipment and processes. However, accurate predictive maintenance of time-series data is difficult. This is because, due to the characteristics of the process equipment, a single equipment experiences various working conditions. It shows various outputs even under similar conditions. Therefore, we proposed a new reconstruction-based anomaly detection. Our method uses a property in which a reconstruction error is calculated through input values and reconstruction values. This builds a sophisticated health indicator (HI) by deferring model selection until the smallest reconstruction value is obtained when training the model. As a result, through advanced HI construction, it is possible to accurately identify and quantify the degree of degradation of machinery. Experiments confirm that the proposed method showed superior performance in terms of initial anomaly detection compared to other models.

Keywords:

LSTM Autoencoder, Multi-mode Data, Time-series Anomaly Detection

1. 서 론

최근 데이터 수집의 확산으로 생산 및 제조업에서 금융 및 의료에 이르기까지 많은 영역에서 시계열 이상 탐지(time-series anomaly detection)에 대한 수요가 증가했다. 또한 제조 공정이 인더스트리 4.0 시대를 맞이하면서, 가상물리시스템 (Cyber Physical System, CPS)과 같은 컴퓨터와 물리 시스템의 오케스트레이션(orchestration)으로 여러 종류의 센서 데이터가 생산 공정에서 수집되고 있다. 다양한 센서 및 데이터 수집 시스템을 통해 수집되는 공정 데이터는 제조 설비의 오작동 비율을 줄이고 생산 프로세스(process)의 효율성을 향상시키는데 활용이 되고 있다.

제조 기업들은 경쟁력 확보를 위해 설비 예지보전(predictive maintenance)을 더욱 효과적으로 수행하고자 노력한다(Hamadache et al., 2019). 건전성 예측 및 관리 (Prognostics and Health Management, PHM)의 대표적 방법론인 예지보전은 설비의 정비가 필요한 시기를 결정한다. 반면에, 설비 고장이 발생하면 수행하는 사후보전(reactive maintenance)은 설비의 고장을 사전에 예방할 수 없어 많은 비용이 발생하는 단점이 존재한다. 또한, 고장이 발생하기 전 일정 주기마다 정비를 수행하는 예방보전(preventative maintenance)은 불필요한 유지보수 단계와 센서나 환경 조건을 고려하지 않고 정비를 수행한다는 비효율성이 존재한다(Carvalho et al., 2019). 그에 반해 예지보전은 설비와 공정에 대한 지속적인 모니터링을 기반으로 특정 시점에서 유지보수가 수행된다는 장점을 가지고 있다. 따라서, 정확한 예지보전 기술은 공정에 필수적이다.

하지만, 공정에서 수집되는 데이터는 형태가 복잡하기 때문에 정확한 예지보전이 어려운 상황이다. 대부분의 공정 데이터는 시스템과 무관한 노이즈(noise)와 같은 정보가 포함되기도 하며, 일반적인 센서 데이터에는 여러 상태가 복합적으로 존재하기 때문이다(Maya et al., 2019).

가장 큰 문제는 공정 설비 특성상, 하나의 설비는 여러 작업 조건을 경험하기 때문에 비슷한 조건에서도 다양한 출력을 보인다는 것이다(Xi et al., 2020). 본 논문에서는 이러한 현상을 멀티 모드(multi-mode)라 명명한다.

멀티 모드는 하나의 데이터가 동일한 입력값(same input)에 대해 다양한 출력값(multi outputs)을 보이는 경우를 의미하며, 시계열 데이터의 멀티 모드에 대한 예제는 <Figure 1>과 같다.

Figure 1.

Multi-mode Example of Time-series Data

<Figure 1>에 초록색 박스로 표시된 부분은 데이터의 입력값을 나타내고, 빨간색 박스로 표시된 부분은 데이터의 출력값을 나타낸다. 초록색 박스는 유사한 입력값(A)을 보이지만, 각각의 출력값(A, B)은 다르다. 이와 같이 고유하지 않은 입출력 관계는 출력값에 대한 적절한 성질을 파악하기 어렵다.

이러한 문제상황은 비정상 데이터뿐만 아니라 정상 데이터 내에서도 발생하는 문제점이다. 공정의 자동화가 이루어질수록 고도화되는 공정 설비로 인해, 복잡한 설비에 사용된 주요 구성품의 성능 저하는 전체적인 공정 운영에 치명적인 문제로 작용한다. 설비의 주요 구성품의 성능 저하는 설비 고장의 주 원인이자 공정 수율(yield) 저하로 이어지는 주된 원인이다. 따라서 사후보전과 예방보전의 한계점을 극복하고, 멀티모드 데이터 상황에서 설비 고장과 유지 보수 시점을 사전에 예측할 수 있는 강건한 예지보전 모델이 필요하다.

본 논문은 기존 선행 연구들의 한계점들을 극복하기 위해 새로운 재구성 기반 이상 탐지(reconstruction-based anomaly detection)를 제안한다. 제안 방법은 기계 고장 발생 시 수집된 데이터를 기반으로 공정 설비의 수명을 대표할 수 있는 건강 지표 (health indicator, HI)를 구축하는 것을 목표로 한다. 재구성 오류(reconstruction error)가 입력값과 재구성 값(reconstruction value)을 통해 계산되는 특성을 이용하여, 가장 적은 재구성 오류를 얻을 때까지 재구성 값을 결정하는 순간을 지연한다. 즉, 모델 학습 시 가장 적은 재구성 값을 얻을 때까지 모델 선택을 연기해 정교한 HI를 구축한다. 따라서, 제안 방법은 미래 상태를 보다 유연하고 정확하게 파악할 수 있다. 결과적으로 고도화된 HI 구축을 통해, 기계의 열화 정도(degradation degree)를 정확하게 식별하고 정량화 할 수 있다.

본 논문의 구성은 다음과 같다. 먼저 제2장에서는 예지보전에 대한 선행 연구와 HI 구축에 관한 선행 연구, 그리고 이상치 탐지 모델 구축 방법을 소개한다. 이후 제3장에서 제안 방법을 설명한 뒤, 제4장에서는 수행한 실험의 설계 및 결과를 서술한다. 마지막으로 제5장에서는 본 연구의 결과 및 추후 연구 방향에 대해 서술하였다.


2. 선행 연구

2.1 예지 보전

PHM의 대표적 방법론인 예지보전에는 도메인 기반 방법론, 모델 기반 방법론 그리고 데이터 기반 방법론이 존재한다. 도메인 기반 예지보전 방법론은 주로 전문가의 지식 또는 경험을 기반으로 한다. 도메인 기반 방법론은 비교적 구현이 간단하다는 장점을 갖고 있지만, 전문 지식이 존재하는 경우만 적용할 수 있다는 단점이 존재한다(Gao et al., 2015).

모델 기반 예지보전 방법론은 시스템의 열화 과정을 상세한 수학적 모델로 해석한다. 모델 기반 방법론은 제일원리(First principle)를 바탕으로, 시스템 식별 및 추정 기술을 사용하여 모델의 매개변수를 추정한다. 해당 방법론의 장점은 정확한 모델이 구축되면 다양한 작동 조건을 설명할 수 있다는 점이다. 다만, 시스템에 해당하는 적합한 모델이 존재하지 않는 경우가 많으며, 존재한다 하더라도 다른 종류의 시스템에 재활용할 수 없다는 단점이 있다(Liao et al., 2014).

데이터 기반 예지보전 방법론은 데이터를 통해 직접 추론할 수 있다는 가정을 기반으로 한다(Baur et al., 2020). 데이터 기반 방법론은 대규모 데이터에 대한 분석이 가능하며, 시스템의 구성 요소에 대한 사전 지식 또는 통계적 모델 지식이 필요로 하지 않다는 장점이 존재한다. 본 논문에서는 데이터 내의 관계를 찾기 위한 방법으로 데이터 기반 예지보전 방법론을 사용한다.

2.2 건강 지표 구축

데이터 기반 PHM 기술은 기계 고장이 발생 시 데이터를 수집하고, 수집된 데이터를 기반으로 공정 설비의 수명을 대표할 수 있는 HI를 구축한다. 그 후, 구축된 HI를 바탕으로 설비의 잔존수명을 예측하는 세 가지 단계를 거친다(Yu et al., 2019). 본 논문에서는 수집된 데이터를 기반으로 공정 설비의 수명을 대표할 수 있는 HI를 고도화하는 것을 목표로 한다.

인공지능을 통한 HI 구축은 크게 예측 기반 모델(predictive-based model)과 재구성 기반 모델(reconstruction-based model)의 두 가지 방법으로 나뉜다. 예측 기반 모델은 수집된 데이터의 미래 값을 예측하고, 실제 데이터와의 차이를 통해 예측 오차를 산출한다.

Park et al.(2020)은 many-to-one 구조를 갖는 다중 채널(channel) Long Short-Term Memory(LSTM)를 사용해 배터리의 다변량 요소를 활용한 잔존 수명(remaining useful life, RUL) 예측모델을 제안하였다. 해당 모델은 간단한 구조로 효율적이지만, 멀티모드 데이터와 같은 복잡한 데이터를 학습하는데 어려움이 존재한다.

She and Jia(2021)은 Bidirectional Gated Recurrent Units(Bidirectional GRU)를 사용하여 베어링의 RUL과 신뢰 구간(control limit)을 예측하였다. 그러나 해당 모델은 다중 변수가 존재하고 가변적인 작업 조건에서 예측 불확실성을 보인다는 문제가 존재한다.

Cai et al.(2020)은 최대 평균 불일치(maximum mean discrepancy, MMD)와 kernel two sample test(KTST)를 사용해 데이터의 유사도를 측정 후, Rao-Blackwellized 파티클 필터(particle filter)로 열화 매개변수(parameter)를 업데이트하는 방법을 제안하였다. 그러나, 해당 모델은 멀티 모드 상황을 고려하지 않기 때문에 일반화 성능이 떨어지는 문제가 존재한다.

한편, 재구성 기반 모델은 수집된 데이터에 대한 재구성 오류를 통해 설비의 성능 저하를 탐지한다. Qin et al.(2021)은 새로운 제약식을 Variational Autoencoder(VAE)에 사용하여 베어링 데이터의 일정한 열화 경향을 파악해 HI를 구축하였다. 그러나, 멀티 모드 상황은 일정한 열화 경향을 반영할 수 없다는 단점이 존재한다.

Fu et al.(2021)은 오토인코더(Autoencoder, AE)와 LSTM을 사용하여 변수 차원과 시간 차원의 데이터의 특징을 추출해 데이터의 유사도를 기반으로 HI를 구축하는 방법을 제안하였다. 하지만, 해당 방법은 초기 HI를 정확하게 반영하는 것이 어렵다는 문제점을 갖고 있다.

Yu et al.(2020)은 Recurrent Neural Network (RNN)와 AE를 사용해 Commercial Modular Aero-Propulsion System Simulation (CMAPSS)에 대한 RUL을 재구성하였다. 그러나 해당 방법은 run-to-failure 학습 데이터가 존재해야만 적용할 수 있다는 문제점을 갖고 있다.

선행 연구들의 공통적인 단점은 멀티 모드 상황에서 하나의 모델만을 적용하여 멀티 모드 데이터를 충분히 반영하지 못한다는 것이다. 따라서 본 논문에서는 하나의 재구성 기반 모델의 다중 레이어(layer)를 사용하여, 모델 학습 시 가장 적은 재구성 값을 얻을 때까지 모델 선택을 연기해 정교한 HI를 구축한다.

2.3 이상치 탐지 모델 구축

본 논문에서는 정상 데이터만 포함된 훈련 데이터 세트(training dataset)와 정상 및 비정상 데이터가 포함된 테스트 데이터 세트(test dataset)를 사용한다.

기계의 상태를 나타내는 시계열 데이터에서 앞부분은 정상 데이터로 설정되며, 나머지 부분은 비정상 데이터로 설정된다. 시계열 데이터에서는 보통 전체 데이터 중 대부분이 정상 데이터로 구성되어 있으므로, 정상 데이터만을 학습하여 모델을 구축하는 것을 목표로 한다. 비정상 데이터는 정상 데이터만을 학습한 모델에 비해 재구성 오류의 편차(deviation)가 클 것이므로, 이를 이용하여 HI 구축을 수행한다.

본 논문에서는 시계열 데이터에서의 이상탐지 문제를 단순화한다. 이상 시점은 <Figure 2>에서 주황색 선으로 표시된 부분과 같이 한 번만 발생하지만, 이후 기계가 교체되기 전까지의 모든 시점에 대해 비정상 상태라고 가정한다.

Figure 2.

Anomaly Detection in Time-series Data

본 논문에서 이상 탐지 모델을 구축하기 위한 단계는 다음 두 단계로 구성된다. 첫 번째 단계에서는 제안 방법을 사용하여 훈련 데이터 세트에서 정상 데이터만을 학습한다. 특히, 정상 데이터를 가능한 한 정확하게 재구성하는 모델을 구축한다.

두 번째 단계에서는, 첫 번째 단계에서 구축한 모델을 사용하여 테스트 데이터 세트의 값을 순차적으로 재구성한다. 그러나, 일반적으로 시계열 데이터에는 노이즈가 포함되어 있다. 노이즈는 모델 결과에 영향을 미칠 가능성이 높기 때문에, 재구성 값에 대해 저주파 통과 필터(low-pass filter, LPF)를 적용한다. 이후 재구성 오류를 통해 이상 정도를 나타내는 이상 점수(anomaly score)를 계산한다.


3. 제안 방법

3.1 LSTM-AE를 활용한 다중 학습

본 논문에서는 이상 탐지를 위해 LSTM 기반 AE를 사용한다. AE와 LSTM은 이상 탐지 분야에서 다양한 방식으로 연구되어 왔다.

Xu et al.(2018)은 주기성을 갖는 시계열 데이터의 이상 탐지를 위해 VAE 기반 이상 탐지 모델을 제안했다. VAE는 데이터의 분포를 학습하기 때문에 AE보다 데이터의 저차원 표현을 정밀하게 나타냄으로써 재구성 성능을 높일 수 있다는 장점이 존재한다.

Chen et al.(2020)은 산업용 로봇의 제어기에서 수집된 다변량 시계열 데이터의 이상 탐지를 위해 Sliding-Window Convolutional VAE(SWCVAE) 모델을 제안하였다. SWCVAE는 슬라이딩 윈도우를 전체 데이터에 적용함으로써 데이터의 주기성을 찾아내고, 다변량 시계열 데이터의 특징을 추출할 수 있다는 장점이 존재한다.

Ghrib et al.(2020)은 LSTM-AE와 Support Vector Machine(SVM)을 결합한 하이브리드 방법을 제안하였다. 복잡한 고차원의 시계열 데이터에 LSTM-AE를 적용하여 정상 데이터의 저차원 표현을 효율적으로 학습하고 정상 데이터와 비정상 데이터의 상관성을 감소시켰다.

Zhao et al.(2020)은 Bidirectional LSTM-AE를 통해 시계열 데이터를 양방향으로 학습하면서 예측 형태로 재구성하고, 재구성 오류에 가우시안(Gaussian) 분류 모델을 적용하여 이상을 탐지하였다. 하지만, 이러한 방법들은 특정 문제 설정이 존재하는 시계열 데이터 적용이 어렵다는 단점이 존재한다.

한편, Maya et al.(2019)은 delayed Long Short-Term Memory(dLSTM)을 제안하여 멀티 모드 문제를 반영한 이상 탐지 모델을 제안했다. dLSTM은 LSTM의 중간 층의 가중치를 공유하면서 마지막 층에만 다중 모델을 설정하여, 예측 시점 직전에 가장 작은 예측 오류를 가진 모델을 선택한다.

본 논문에서는 이에 영감을 받아 LSTM-AE를 이용한 다중 학습 방법을 제안한다. 시계열 데이터의 예측 기반의 dLSTM과 달리, 제안 방법은 재구성 오류에 초점을 둔다. 즉, 제안방법은 인코더(encoder)와 디코더(decoder)가 LSTM 레이어로 구성되어 데이터의 시간 의존성을 고려한다. 또한, 디코더 마지막 레이어가 AE의 재구성 값과 입력값의 차이를 최소화하는 다중 레이어로 구성되어 있다. 이를 통해 재구성 시점 직전, 가장 작은 재구성 오류를 가진 모델을 선택할 수 있도록 한다. 재구성 오류에 대한 식은 다음 식 (1)과 같다.

Reconstruction error=x-gθfθx(1) 

재구성 오류는 재구성 값과 입력값의 차이로 정의된다. 식 (1)에서 fθ는 인코더를 의미하며, gθ는 디코더를 의미한다. 즉, 입력 값 x와 인코더와 디코더를 통과한 재구성 값 gθ(fθ(x))의 차이로 재구성 오류가 정의되는 것이다. 본 논문에서는 이러한 특성을 이용하여 해당 입력값을 사용할 수 있을 때까지 재구성 값을 얻는 타이밍을 지연시킨다. 제안 방법은 재구성 오류가 가장 적은 모델을 선택하고, 역전파(backpropagation)를 이용하여 해당 모델의 매개변수만 업데이트한다. 따라서, 입력값에 보다 구체적인 모델을 생성할 수 있다.

제안방법은 크기 w 데이터를 순차적으로 재구성한다. 즉, <Figure 3>과 같이 시점 t + 1에서 t + w에 대한 입력값에서 재구성 값을 얻는 경우를 고려한다. 일반적으로 기존 모델들의 재구성 값은 배치(batch) 단위로 학습이 진행되기 때문에, 동일 배치에서 같은 크기인 w만큼 j + 1에서 j + n + 1 사이값으로 전부 재구성된다(Chauhan and Vig, 2015). 여기서 j는 재구성되는 값을 나타내며, n은 각 시점에서 재구성되는 값의 변동을 나타낸다. 이는 <Figure 3>의 녹색 원으로 표시된다.

Figure 3.

Example of Obtain Reconstructed Values

대조적으로, 제안 방법은 시점 t에서 크기 w 데이터들에 대해 회색 원으로 표시된 후보 값(candidate values)을 제공한다. 따라서, 해당 재구성 값을 얻은 시점에서 빨간색 원으로 표시된 입력값과의 차이가 가장 적은 값으로 재구성 값(파란색 원)을 결정한다. 즉, 제안 방법은 시점 i(t + 1 ≤ it + w)에서 재구성된 값의 정보를 고려하여 값을 순차적으로 재구성한다. 따라서 기존의 방법에서 입력값의 정보를 전부 포함하지 않는 것과는 달리, 제안 방법은 재구성 값을 결정할 때 입력값의 정보가 포함되는 것이다.

제안 방법은 <Figure 4>와 같이 디코더 부분에 다중 레이어를 사용하며, 다중 레이어의 수를 N으로 표시한다. 시점 t + 1에서 t + w에 대한 입력 및 재구성 값을 Xt+1:t+w,Yt+1:t+wRw로 정의하고 fnN번째 재구성 모델이라 하면, 해당 모델의 재구성 값은 식 (2)와 같이 표현된다.

Yt+1:t+wn=gθnfθnXt+1:t+w(2) 
Figure 4.

Overview of Reconstruction-based Anomaly Detection for the Proposed Method

식 (2)에서 Yt+1:t+wn는 각 시점에서의 재구성된 값의 집합 yt+1n,,yt+wn를 의미하며, n ∈ {1, 2, ..., N}이다.

본 논문에서는 재구성 값을 구하는 모델에 대해 LSTM 기반 AE를 사용한다. 딥러닝(deep learning) 모델을 사용하기 때문에 복잡한 입출력 관계를 포착할 수 있다는 장점이 존재한다. 따라서, 제안 방법은 LSTM 기반 AE를 통해 특정 시점 i에서 재구성 값의 후보(yin) 중 가장 작은 재구성 오류를 갖는 재구성 값(yi)을 결정한다.

Xt+1:t+w는 각 시점에서의 입력값의 집합 xt+1,,xt+w를 의미하므로, 특정 시점 i에서 최종 재구성 값은 식 (3)과 같이 계산된다.

yi=yin*, where n*=argminnxi-yin(3) 

제안 방법은 최적의 재구성 값 Yt+1:t+wn*를 얻기 위해 시점 t + 1에서 t + w까지 동일 절차를 반복한다. 이를 통해 재구성 오류가 가장 작은 모델을 선택하고 역전파를 이용하여 해당 모델의 매개변수만 업데이트하여 재구성 오류가 감소하도록 한다. 그 결과, 입력값에 보다 구체적인 모델을 생성할 수 있다.

본 논문에서 고려하는 멀티 모드 상황의 데이터는 하나의 데이터가 동일한 입력값에 대해 다양한 출력값을 보이는 경우를 의미한다. 제안 방법은 모든 시점에 대해 재구성 오류가 작은 값을 사용하기 때문에 기존 방법보다 데이터에 구체적인 모델을 구축할 수 있다. 따라서, 복잡한 시계열 데이터에 대해 정교한 이상 탐지가 가능하다.

3.2 건강 지표 계산

시계열 데이터는 종종 노이즈의 영향을 받는다. 본 논문에서는 재구성 오류를 기반으로 노이즈의 영향에 강건한(robustness) 이상 점수를 도출하기 위해 특정 필터를 사용한다. 크기 w 데이터에 대해 중간값 필터(median filter) 유형의 LPF를 사용한다. 시점 t에서 이상 점수는 다음 식 (4)와 같이 도출된다.

St=medianit-w+1,t-w+2,,txi-yi(4) 

모델의 대부분의 매개변수는 훈련 데이터 세트의 정상 데이터에서 학습된다. 따라서 S(t)는 테스트 데이터 세트의 비정상 데이터에 대해서도 정상 상태로부터 데이터의 편차를 측정한다. 초 매개변수(hyperparameter) w는 데이터에 따라 사용자가 설정하는 값이다. 큰 크기의 w는 노이즈 영향을 제거하기 때문에 성능이 안정화된다. 그러나 작은 크기 w는 시계열 데이터에 대한 이상 징후를 보다 신속하게 감지할 수 있다는 장점이 존재한다.

일반적으로 제조 공정에서는 두 가지 오류, 정상을 비정상으로 잘못 분류하는 거짓 양성(false positive, FP)과 비정상을 정상으로 잘못 분류하는 거짓 음성(false negative, FN)이 존재한다. 제조 공정 상황을 고려하면 FP가 FN보다 더 문제가 될 가능성이 높다. 오탐(false alarm)이 자주 발생하게 되면, 이를 처리하기 위한 인력 수요가 증가한다. 이러한 문제상황은, 실제 이상이 발생했을 때 처리할 여력이 없는 경우가 발생할 수 있다. 따라서, 본 논문에서는 적절한 크기의 w를 실험적으로 설정하였다.


4. 실험 결과

본 논문에서 제안하는 기계의 HI 구축을 위한 재구성 기반 이상 탐지의 성능을 평가하기 위해 제조 공정에서 발생하는 데이터를 대상으로 실험을 수행하였다.

4.1 데이터 전처리

일반적으로 정상 데이터에도 이상치가 포함되는 경우가 존재한다. 단순히 정상 데이터를 나누고, 이에 대한 모델을 구축하면 일반화 성능이 저하될 수 있다. 따라서, 본 논문에서는 훈련 데이터 세트에서 이상치를 제거하여 일반화 성능을 향상시켰다.

훈련 데이터 세트의 평균과 표준편차를 각각 μσ로 표현하면, 시점 t의 값이 다음 식 (5)를 만족하지 않을 때 이상치로 간주한다.

μ-3σ<Traing Dataset<μ+3σ(5) 

이상치로 간주된 데이터 포인트들은 일반화 성능을 위해 제거하였다.

4.2 실험 설계

본 논문에서 사용한 데이터 셋은 해외 제조회사의 배관 평가 데이터이다. 데이터는 압력, 하중, 펌프 온도, 보조난방, 음향 유발 진동의 총 5개 변수로 이루어져 있으며, 데이터의 형태는 <Figure 5>와 같다. 데이터의 전체 타임스탬프(timestamp)의 길이는 2,600이다.

Figure 5.

Assessment Data of Machinery

데이터의 보안상 x축과 y축에 대한 자세한 범주 정보는 표기하지 않았으며, <Figure 5>를 통해 데이터가 멀티 모드 상황을 갖는 것을 확인할 수 있다.

제조 공정에서 일반적으로 사용되는 스케일링(scaling) 방법으로 Z-normalization을 사용하였으며, 최적화 함수로는 ReLU를 사용하였다. 또한 역전파 방법에는 Adam(Kingma and Ba, 2014)을 사용하였으며, 재구성 오류를 구하기 위한 손실 함수(loss function)로 식 (6)과 같이 mean absolute error (MAE)를 사용하였다.

MAE=xi-yin*n(6) 

식 (6)에서 xi는 실제 값이고 yin*는 재구성 값을 의미한다. 즉, 식 (6)은 실제 값과 재구성 값의 차이의 합에 대해 전체 개수 n으로 나눈 값으로, 오류 크기의 평균을 의미한다. MAE는 오류의 차이를 직관적으로 판단할 수 있다는 장점이 있기 때문에, 본 논문에서 이를 손실 함수로 사용한다.

훈련 데이터 세트와 테스트 데이터 세트의 비율을 4:6으로 나누었다. 훈련 데이터 세트는 본 논문에서 사용된 데이터의 완전한 정상 상태만을 포함하기 위해 전체 데이터 길이의 40%로 설정하였다. 또한, 이상 탐지의 특정 기준인 임계값(threshold)를 결정하기 위해, 테스트 데이터 세트에서 앞 시점 일부분을 검증 데이트 세트(validation dataset)로 사용하였다. 따라서 훈련 데이터 세트와 검증 데이터 세트, 그리고 테스트 데이터 세트의 비율은 4:1:5이다.

훈련 데이터 세트로 모델을 학습하고 검증 데이터 세트를 통해 모델의 과적합을 판별하였다. 반복적인 실험을 통해 모든 모델의 Epoch는 100으로, w의 크기는 15로 임의 설정하였다.

4.3 모델 간 성능 비교

본 논문에서 모델의 성능을 평가하기 위해, 두 가지 모델과 비교하였다. 우선, 단일 재구성 모델과 비교하기 위해 일반적인 Vanilla LSTM-AE를 선정하였으며, 다중 재구성 모델로는 Vanilla LSTM-AE가 여러 개 사용된 Ensemble LSTM-AE를 선정하여 비교하였다. 제안 방법 디코더 부분의 다중 레이어의 수 N은 5로 설정하였으며, Ensemble LSTM-AE도 동일하게 Vanilla LSTM-AE가 5개로 이루어진 앙상블(ensemble) 결과로 모델을 구성하였다.

Ensemble LSTM-AE는 Vanilla LSTM-AE에 대한 앙상블 결과로 구성되어 있기 때문에, Vanilla LSTM-AE와 학습 구조 및 매개변수가 동일하다. 따라서, 모델의 손실 함수도 동일하다고 볼 수 있다. 본 논문에서 임계값 설정을 위해 고려해야 할 손실 함수의 분포는 <Figure 6>과 같이 두 가지로 구성된다.

Figure 6.

MAE Loss Distribution

<Figure 6>의 (a)는 제안 방법에 대한 MAE 손실 함수의 분포를 나타낸다. <Figure 6>의 (b)는 Vanilla LSTM-AE에 대한 MAE 손실 함수의 분포를 나타낸다. 손실 함수 분포에 대해 99.9% 분위수(quantile) 값을 기준으로 임계값을 설정하였으며, 각각 0.12와 0.14의 값을 갖는 것을 확인 가능하다.

임계값을 기준으로 각 모델의 테스트 데이터 세트에 대한 이상 점수 시각화 성능 비교 결과는 <Figure 7>과 같다.

Figure 7.

Experimental Results for Anomaly Score

제안 방법은 노이즈 영향을 완화하기 위해 재구성 값에 대해 LPF를 적용한 뒤 점수를 계산한다. <Figure 7> (a), (b)는 제안 방법의 시각화 결과를 나타낸다. 재구성 오류가 가장 적은 모델을 선택하기 때문에, 다른 방법 대비 안정적인 이상 점수를 보인다. 특히, LPF 적용 유무에 따라 노이즈 완화 효과를 확인 가능하다. 하지만 <Figure 7> (c)의 Vanilla LSTM-AE의 경우, 이상 점수가 안정적으로 학습되지 못한 것을 확인 가능하다. 또한 <Figure 7> (d)의 Ensemble LSTM-AE는 어느정도 안정적으로 학습이 되었으나, 제안 방법에 비해서는 느린 탐지를 보이는 것을 확인 가능하다.

본 논문에서는 실제 이상 시점 이후 기계가 교체되기 전까지의 모든 시점에 대해 비정상 상태라고 가정하였다. <Figure 7>에서 초록색으로 표시되는 부분이 실제 이상을 나타내며, 노란색 부분은 각 모델 별 이상을 나타낸다. 이상 점수의 정량적 성능은 식 (7)과 같이 실제 이상 대비 모델 이상의 비율로 측정하였다.

Anomaly Ratio =Model AnomalyTrue Anomaly(7) 

<Figure 7> (a), (b), (c), 그리고 (d)의 이상 비율(anomaly ratio)은 각각 0.67, 0.61 0.35, 그리고 0.53의 값을 갖는다. 간단한 가정을 전제로 단순 이상의 비율로 측정하였기 때문에, 전체적인 이상 비율은 낮은 것을 알 수 있다. 하지만, 제안 방법이 다른 모델 대비 학습의 안정성이 뛰어난 것으로 확인 가능하다.

제안 방법은 모델 학습 시 가장 적은 재구성 값을 얻을 때까지 모델 선택을 연기해 정교한 HI를 구축한다. 제안 방법과, Vanilla LSTM-AE, 그리고 Ensemble LSTM-AE에 대한 학습 안정성 및 성능을 파악하기 위해 특정 시점 구간에 대한 MAE 값을 비교한 결과는 <Table 1>과 같다. 특정 시점 구간으로 본 논문에서 사용된 배치의 크기인 w만큼 MAE 값을 비교하였다. 본 논문에서는 w의 크기를 편의상 15로 설정하였기에 15개 시점을 기준으로 결과를 비교하였다.

Performance Comparison for 15 Time Points

Ensemble LSTM-AE도 우수한 학습 안정성 및 성능을 보이는 것을 확인 가능하지만, 제안 방법이 안정적으로 높은 성능을 보이는 것을 알 수 있다. 제안 방법이 각 시점 별 후보 값들 중 가장 적은 재구성 오류를 가지는 값을 선택하기 때문에 안정적인 학습이 가능한 것이다.

Vanilla LSTM-AE와 Ensemble LSTM-AE의 경우 15개의 시점이 한 번에 재구성되지만, 제안 방법은 모델에서 각 시점 별 후보 값들 중 가장 적은 재구성 오류를 가지는 값을 선택한다. 제안 방법이 최적의 모델을 선택하는 과정에 대한 MAE 값의 비교는 <Table 2>와 같다.

MAE Candidate Values by Model of Our Method

<Table 2>는 제안 방법에 사용된 5개의 모델들의 15시점에 대한 후보 값을 나타낸다. 각 모델 별 볼드(bold) 표시는 각 시점 별 가장 적은 MAE 값을 나타내며, 표의 마지막 열은 시점 별 가장 적은 MAE 값으로 구성된 것을 확인 가능하다. Ensemble LSTM-AE와 비슷한 방법으로 학습이 수행되지만, 특정 시점 구간의 재구성 값을 전부 고려한다는 점에서 제안 방법과의 차이가 존재한다.


5. 결 론

본 논문은 공정에서 수집되는 시계열 데이터의 멀티 모드 특성을 고려한 이상 탐지 방법을 제시하였다. 특히 재구성 기반 방법 중 AE 기반 모델의 변형을 제안하였다. 제안 방법은 디코더의 마지막 레이어를 다중으로 구성하여, 가장 적은 재구성 오류를 가지는 모델을 선택한다. 실험 결과, 일반적인 모델 대비 이상 시점을 더 빠르게 탐지 가능한 것을 확인하였다. 또한, 각 공정 별로 오탐 탐지 스케일에 대한 직접적인 조절이 가능하다는 장점이 존재한다.

추후 RUL 예측으로 운영 효율 향상 및 생산 리스크 최소화, 생산 효율성 개선 및 수명주기 비용을 감소시킬 수 있을 것으로 기대한다. 하지만 모델의 강건성에 대한 검증과, 변수의 수가 많아졌을 경우 모델 학습에 대한 시간 증가 문제가 존재할 것으로 생각된다.

Acknowledgments

이 연구는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구(NRF-2022R1A2C2004457, NRF-2021R1A6A3A13045200)이며, 중소벤처기업부의 기술개발사업 지원에 의한 연구(S2837675)임. 또한, 4단계 두뇌한국21사업과 삼성전자(Samsung Electronics)의 지원을 통하여 수행되었음(IO201210-07929-01).

References

  • Baur, M., Albertelli, P., and Monno, M. (2020), A review of prognostics and health management of machine tools, The International Journal of Advanced Manufacturing Technology, 107(5), 2843-2863. [https://doi.org/10.1007/s00170-020-05202-3]
  • Cai, H., Feng, J., Li, W., Hsu, Y. M., and Lee, J. (2020), Similarity-based particle filter for remaining useful life prediction with enhanced performance, Applied Soft Computing, 94, 106474. [https://doi.org/10.1016/j.asoc.2020.106474]
  • Carvalho, T. P., Soares, F. A., Vita, R., Francisco, R. D. P., Basto, J. P., and Alcalá, S. G. (2019), A systematic literature review of machine learning methods applied to predictive maintenance, Computers & Industrial Engineering, 137, 106024. [https://doi.org/10.1016/j.cie.2019.106024]
  • Chauhan, S. and Vig, L. (2015), Anomaly detection in ECG time signals via deep long short-term memory networks, In 2015 IEEE International Conference on Data Science and Advanced Analytics (DSAA), 1-7. [https://doi.org/10.1109/DSAA.2015.7344872]
  • Chen, T., Liu, X., Xia, B., Wang, W., and Lai, Y. (2020), Unsupervised anomaly detection of industrial robots using sliding-window convolutional variational autoencoder, IEEE Access, 8, 47072-47081. [https://doi.org/10.1109/ACCESS.2020.2977892]
  • Fu, S., Zhong, S., Lin, L., and Zhao, M. (2021), A novel time-series memory auto-encoder with sequentially updated reconstructions for remaining useful life prediction, IEEE Transactions on Neural Networks and Learning Systems. [https://doi.org/10.1109/TNNLS.2021.3084249]
  • Gao, Z., Ding, S. X., and Cecati, C. (2015), Real-time fault diagnosis and fault-tolerant control, IEEE Transactions on industrial Electronics, 62(6), 3752-3756. [https://doi.org/10.1109/TIE.2015.2417511]
  • Ghrib, Z., Jaziri, R., and Romdhane, R. (2020), Hybrid approach for anomaly detection in time series data, In 2020 International Joint Conference on Neural Networks (IJCNN), 1-7. [https://doi.org/10.1109/IJCNN48605.2020.9207013]
  • Hamadache, M., Jung, J. H., Park, J., and Youn, B. D. (2019), A comprehensive review of artificial intelligence-based approaches for rolling element bearing PHM: Shallow and deep learning, JMST Advances, 1(1), 125-151. [https://doi.org/10.1007/s42791-019-0016-y]
  • Kingma, D. P. and Ba, J. (2014), Adam: A method for stochastic optimization, arXiv preprint arXiv:1412.6980, .
  • Liao, L. and Köttig, F. (2014), Review of hybrid prognostics approaches for remaining useful life prediction of engineered systems, and an application to battery life prediction, IEEE Transactions on Reliability, 63(1), 191-207. [https://doi.org/10.1109/TR.2014.2299152]
  • Maya, S., Ueno, K., and Nishikawa, T. (2019), dLSTM: A new approach for anomaly detection using deep learning with delayed prediction, International Journal of Data Science and Analytics, 8(2), 137-164. [https://doi.org/10.1007/s41060-019-00186-0]
  • Park, K., Choi, Y., Choi, W. J., Ryu, H. Y., and Kim, H. (2020), LSTM-based battery remaining useful life prediction with multi-channel charging profiles, IEEE Access, 8, 20786-20798. [https://doi.org/10.1109/ACCESS.2020.2968939]
  • Qin, Y., Zhou, J., and Chen, D. (2021), Unsupervised health Indicator construction by a novel degradation-trend-constrained variational autoencoder and its applications, IEEE/ASME Transactions on Mechatronics. [https://doi.org/10.1109/TMECH.2021.3098737]
  • She, D. and Jia, M. (2021), A BiGRU method for remaining useful life prediction of machinery, Measurement, 167, 108277. [https://doi.org/10.1016/j.measurement.2020.108277]
  • Xi, X., Zhou, D., Chen, M., and Balakrishnan, N. (2020), Remaining useful life prediction for fractional degradation processes under varying modes, The Canadian Journal of Chemical Engineering, 98(6), 1351-1364. [https://doi.org/10.1002/cjce.23666]
  • Xu, H., Chen, W., Zhao, N., Li, Z., Bu, J., Li, Z., Liu, Y., Zhao, Y., Pei, D., Feng, Y., Chen, J., Wang, Z., and Qiao, H. (2018), Unsupervised anomaly detection via variational auto-encoder for seasonal kpis in web applications, In Proceedings of the 2018 World Wide Web Conference, 187-196. [https://doi.org/10.1145/3178876.3185996]
  • Yu, W., Kim, I. Y., and Mechefske, C. (2019), Remaining useful life estimation using a bidirectional recurrent neural network based autoencoder scheme, Mechanical Systems and Signal Processing, 129, 764-780. [https://doi.org/10.1016/j.ymssp.2019.05.005]
  • Yu, W., Kim, I. Y., and Mechefske, C. (2020), An improved similarity-based prognostic algorithm for RUL estimation using an RNN autoencoder scheme, Reliability Engineering & System Safety, 199, 106926. [https://doi.org/10.1016/j.ress.2020.106926]
  • Zhao, J., Li, Y., He, H., and Deng, F. (2020), One-step Predictive Encoder-Gaussian Segment Model for Time Series Anomaly Detection, In 2020 International Joint Conference on Neural Networks (IJCNN), 1-7. [https://doi.org/10.1109/IJCNN48605.2020.9207569]
저자소개

송승환 : 고려대학교 통계학과에서 2019년 학사학위를 취득하고 고려대학교에서 산업경영공학과 석박사통합과정에 재학 중이다. 연구분야는 딥러닝, 생성모델, 시계열 데이터 분석이다.

황우영 : State University of New York Stony Brook University에서 2020년 학사학위를 취득하고 고려대학교에서 산업경영공학과 석사과정에 재학 중이다. 연구분야는 데이터 마이닝, 딥러닝이다.

이유진 : 이화여자대학교 통계학과에서 2022년 학사학위를 취득하고 고려대학교에서 산업경영공학과 석사과정에 재학중이다. 연구분야는 시계열 데이터 이상탐지이다.

백준걸 : 고려대학교 산업경영공학부에서 1993년 학사, 1995년 석사, 2001년 박사학위를 취득하였다. 인덕대학교와 광운대학교에서 교수를 역임하였으며, 2008년부터는 고려대학교 산업경영공학부 교수로 재직하고 있다. 연구 분야는 Intelligent Diagnosis and Prognosis, Data Science for Manufacturing이다.

Figure 1.

Figure 1.
Multi-mode Example of Time-series Data

Figure 2.

Figure 2.
Anomaly Detection in Time-series Data

Figure 3.

Figure 3.
Example of Obtain Reconstructed Values

Figure 4.

Figure 4.
Overview of Reconstruction-based Anomaly Detection for the Proposed Method

Figure 5.

Figure 5.
Assessment Data of Machinery

Figure 6.

Figure 6.
MAE Loss Distribution

Figure 7.

Figure 7.
Experimental Results for Anomaly Score

Table 1.

Performance Comparison for 15 Time Points

Vanilla
LSTM-AE
Ensemble
LSTM-AE
Proposed
Method
1 0.0005 0.0001 0.0001
2 0.0038 0.0285 0.0013
3 0.0068 0.0040 0.0084
4 0.0131 0.0107 0.0201
5 0.0037 0.0089 0.0119
6 0.0268 0.0209 0.0092
7 0.0077 0.0019 0.0112
8 0.0138 0.0060 0.0198
9 0.0018 0.0254 0.0191
10 0.0217 0.0251 0.0139
11 0.0347 0.0151 0.0199
12 0.0082 0.0197 0.0021
13 0.0341 0.0256 0.0101
14 0.0296 0.0228 0.0025
15 0.0135 0.0034 0.0151
MAE 0.2197 0.2179 0.1647

Table 2.

MAE Candidate Values by Model of Our Method

Model
1 2 3 4 5 Best
1 0.0081 0.0079 0.0001 0.0083 0.0087 0.0001
2 0.0015 0.0222 0.0013 0.0014 0.0014 0.0013
3 0.0084 0.0089 0.0094 0.0087 0.0085 0.0084
4 0.0201 0.0214 0.0224 0.021 0.0205 0.0201
5 0.0134 0.0119 0.0128 0.0125 0.0122 0.0119
6 0.0103 0.0094 0.0099 0.0097 0.0092 0.0092
7 0.0125 0.0117 0.0119 0.0112 0.0114 0.0112
8 0.0198 0.0207 0.0211 0.0221 0.0202 0.0198
9 0.0191 0.0199 0.0203 0.0213 0.0194 0.0191
10 0.0142 0.0146 0.0149 0.0156 0.0139 0.0139
11 0.0208 0.0199 0.0212 0.0223 0.0203 0.0199
12 0.0024 0.0022 0.0021 0.0023 0.0022 0.0021
13 0.0103 0.0105 0.0101 0.0113 0.0108 0.0101
14 0.0026 0.0025 0.0028 0.0027 0.0027 0.0025
15 0.0154 0.0151 0.0169 0.0161 0.0157 0.0151
MAE 0.1789 0.1988 0.1772 0.1865 0.1771 0.1647