Journal of the Korean Institute of Industrial Engineers
[ Article ]
Journal of the Korean Institute of Industrial Engineers - Vol. 47, No. 6, pp.539-548
ISSN: 1225-0988 (Print) 2234-6457 (Online)
Print publication date 15 Dec 2021
Received 15 Sep 2021 Revised 04 Nov 2021 Accepted 08 Nov 2021
DOI: https://doi.org/10.7232/JKIIE.2021.47.6.539

해군 전투함정의 계획정비 효과 추정

최진우 ; 문성암
국방대학교 국방관리학과
Estimation of the Effectiveness of Planned Maintenance of Naval Battleships
Jinwoo Choi ; Seongam Moon
Department of Defense Management, Korea National Defense University

Correspondence to: 문성암 교수, 33021 충남 논산시 황산벌로 1098번길 46 국방대아파트 110동 1003호, E-mail : chlwlsdn8570@gmail.com

© 2021 KIIE

Abstract

The failure function represents the probability of occurrence of failure by the life. The failure function applied to the probability-based maintenance was derived from the recorded failure data while performing the planned maintenance. The maintenance system should be analyzed using the data from which the maintenance effect has been removed. Maintenance effect is the degree of equipment condition that is improved by performing maintenance. In this study, the Bayesian inference method was used to derive the maintenance effect to be removed. A survey was conducted on engine operators to establish a prior distribution of maintenance effects. The Navy assumes that the maintenance effect is 100% complete maintenance, but as a result of the posterior analysis, the maintenance effect was at the level of 73%.

Keywords:

Failure Function, Maintenance Effect, Naval Ship Engine Data, Bayesian Inference

1. 서 론

해군은 함정 엔진의 정격 성능 유지를 위해 연 2회 계획정비를 수행중이다. 계획정비 주기는 엔진 제작사 매뉴얼에 기재된 MTBF(Mean Time Between Failure)를 따른다. 임무주기와 연계하여 함정은 대략적으로 4.5개월 운용, 1.5개월 정비의 패턴을 반복한다(ROK Navy, 2018). 이와 같이 일정한 간격으로 수행하는 계획정비제도를 기간 고정형 정비라고 한다(Choi et al., 2021).

총 수명주기 동안 고장 발생량은 욕조형태(Bathtub)를 따른다고 알려져 있다. 고장 발생량이 수명에 따라 달라진다면 일정주기로 운용과 정비를 반복하는 정비제도는 비효율적이다. 고장이 많이 발생하는 구간이 있는 반면 적게 발생하는 구간도 있기 때문이다. 효율적인 정비제도를 구축하기 위해서는 총수명간 고장 발생량의 변화를 확인해야한다.

욕조형태를 바탕으로 고장함수를 추정하고자 하는 연구가 있었다. Wang and Yin(2019)은 욕조형태의 고장추세(trend)를 와이블(Weibull) 분포에 적합하고, 임의로 발생하는 확률적 요소를 ARIMA(Auto Regressive Integration Moving Average)로 예측하였다. 추세와 확률요소를 GAM(Generalized Additive Model)로 결합하여 고장함수를 도출하였다. 이는 총 수명주기 동안 발생한 고장 데이터의 전체가 필요하며, 특정 설비(원전 발전기) 분석에 국한된다는 한계가 있다. 분포의 모수를 추정하는 방법으로 포아송 분포(Sherbrooke, 2006)와 와이블 분포(Zammori et al., 2020)를 적용한 연구가 있으나, 연구에 사용된 데이터에 국한되어 일반화가 어렵다. 이들 연구와는 달리 Taylor and Letham(2018)은 분포의 모수 적합에 치중하지 않았다. 이들은 시계열 데이터의 추세, 계절성(Seasonality)을 퓨리에 분할 후 각 특성을 다시 결합시키는 프로핏(Prophet) 알고리즘을 제안하였다. 단, 프로핏은 추세와 계절성이 명확하지 않은 경우 성능이 떨어진다. Moon and Choi(2021)는 해군 함정 데이터에 계층형 베이지안 추정법(Hierachical bayesian inference)을 적용하여 고장함수를 도출하였다. 이 연구의 비교모델로 ARIMA와 프로핏이 활용되었으며, 계층형 베이지안 모델의 성능이 가장 좋았다. 계층형 베이지안 추정법은 유사한 데이터들을 계층형으로 구조화하고, 모수를 통한 계층간 정보 공유(Information pooling)로 데이터를 최대 활용하는 방법이다(Gelman, 2006). 따라서 추가적인 데이터가 확보되어도 모델의 재구축이 불필요하므로 상대적으로 일반화된 모델을 구축할 수 있다는 장점이 있다(Gelman et al., 2013; Taieb et al., 2017).

Choi et al.(2020; 2021)은 Moon and Choi(2021)의 해군 함정 엔진의 고장함수를 활용하여 확률 기반형 정비제도를 제안하였다. 확률 기반형 정비는 총 수명주기 동안 발생하는 고장확률의 변화에 따라 정비 주기를 다르게 적용한다. 확률 기반형 정비에서는 고장함수에 따라 일정 누적 고장확률을 넘으면 계획정비를 수행한다. Choi et al.(2021)은 이를 시스템 다이나믹스를 이용하여 해군의 현행 계획정비 제도(기간 고정형 정비)와 비교하였다. 비교결과 총 수명주기 동안의 계획정비 횟수가 22.3% 감소하였고, 함정의 운용 가용도가 3.8% 상승하였다. 또한 함정 임무 수행 중 노출되는 최대 고장확률이 63%감소하고, 1회 계획정비 수행 시 정비부대에서 수행하는 업무량의 편차가 83.7% 감소하였다. 즉, 확률 기반형 정비 제도 적용 시 운용과 정비의 안정성을 동시에 확보하는 장점이 있다. 단, 확률 기반형 정비 적용 시 정비간격은 최소 0.1667 ~ 최대 1.25년, 표준편차 0.2579로 유동적이다. 다시 말하면, 계획정비 주기 설정에 높은 유연성을 요구한다.

확률 기반형 정비는 현행 해군의 정비제도에 비해 함정 운용 가용도, 정비 안정성, 예산 활용 측면에서 우수하다. Choi et al.(2020, 2021)의 연구는 공통적으로 해군 함정 엔진의 고장데이터를 활용하였다. 이 데이터는 해군의 기간 고정형 계획정비를 수행하면서 발생한 고장에 대한 데이터이다. 데이터에 이미 기간 고정형 계획정비의 효과가 반영되어 있으므로, 이를 활용한 다른 계획정비 효과 분석은 계획정비의 중첩효과가 적용되는 것과 같다. 계획정비 제도를 도출하기 위해서는 현행 계획정비 제도의 효과를 제거한 데이터를 활용해야 한다. 다시 말하면, 계획정비 제도의 효과를 분석하기 위해서는 데이터에서 시행중인 계획정비의 효과를 먼저 제거해야한다. 즉, 고장 데이터로부터 계획 정비효과를 먼저 추정해야 한다.

계획정비의 효과란, 정비를 통해 장비의 상태가 이전과 같거나 좋아지는 정도를 뜻한다. 상태가 저하된 부품이 100개인 장비를 예로 들 수 있다. 이 장비를 정비하였을 때 90개의 부품이 완전하게 정비되고, 나머지 10개가 불완전하게 정비되었다면 90%의 정비효과가 있다고 할 수 있다. 이 장비 운용중 고장이 발생한다면 불완전 정비된 10개의 부품 때문일 가능성이 크다. 만약 정비를 수행하지 않았다면 100개의 부품 때문에 고장날 가능성이 크다. 즉, 정비효과란 정비를 수행함으로서 감소된 고장 위험 범위의 축소량을 의미한다. 군 뿐만 아니라 산업체의 장비들도 일반적으로 주기적인 계획정비를 수행한다. 따라서 운용중 발생한 고장데이터에는 계획정비의 효과가 포함되어 있다. 다시 말하면 일반적인 고장 데이터는 계획정비를 수행하여 고장 위험 범위가 축소된 상태에서 발생한 고장의 기록이다.

따라서 본 연구의 목적은 Choi et al.(2020; 2021)의 연구에 활용된 데이터에서 기존에 수행하던 계획정비(기간 고정형 계획정비)의 효과를 도출하는 것이다. 고장 데이터에서 정비효과를 추정하기 위한 방법으로 베이지안 추정법을 수행하였다. 베이지안 추정에는 데이터와 함께 사전분포(prior)가 필요하다. 실증적 베이지안(empirical bayesian) 추정법에서는 사전분포를 설정할 때 데이터의 형태를 먼저 확인한다. 데이터를 먼저 확인함으로서 사전분포의 형태와 모수 선택에 이득을 얻을 수 있다. 본 연구의 사전분포는 고장이 발생할 수 있는 범위에 대한 확률분포와 정비효과에 대한 전문가들의 설문조사 의견으로 2가지를 구성하였다. 고장확률의 사전분포는 고장 데이터를 확인하고 실제 고장이 발생할 수 있는 범위에 대한 믿음을 확률 분포로 나타낸 것이다. 이는 엔진의 부품들 중에 수명 연차별로 몇 개의 부품에서 고장이 발생할 것인가에 대한 확률이다. 정비효과는 명확한 확률 수치를 구하기 힘들다. 일반적으로 정비는 정격성능을 발휘할 수 있는 수준으로 수행된다. 정격성능은 장비가 정상적으로 기능을 수행할 수 있는 수준이며, 이것이 새것과 같은 완전한 정비가 이루어진 상태를 뜻하지는 않는다. 따라서 정비효과의 사전확률분포를 도출하기 위해 본 연구에서는 데이터에 포함된 엔진들을 실제 운용하는 전문가들을 대상으로 설문조사를 수행하여 전문가들의 의견을 바탕으로 사전 확률분포로 적합하였다. 해군의 고장데이터를 바탕으로 사전확률들의 범위가 축소되어 사후분포가 도출된다. 도출되는 사후분포는 두 가지이다. 한 가지는 해군에서 현재 주기적으로 수행하고 있는 계획정비의 효과이다. 성능저하개소가 100개라고 할 때 정비 후 성능저하개소는 몇 개가 되는지 도출된다. 즉, 계획정비를 수행하여 성능이 좋아질 확률이 도출된다. 다른 한 가지는 수명별 고장발생확률이다. 일반적으로 내연기관은 6,000개의 부품으로 구성된다. 작동중인 부품수 * 고장확률은 고장부품수가 된다. 해군의 고장 데이터를 통해 몇 %의 부품이 고장나는지에 대한 수명별 확률이 도출된다.

본 연구의 결과는 군 뿐만 아니라 산업장비에도 적용 가능하다. 서두에서 언급한바와 같이 고장 발생 데이터를 유지하여도 데이터에는 수행하고 있는 계획정비의 효과가 포함되어 있기 때문이다. 정비 정책의 개선, 예산분석 등을 위해서는 계획정비의 효과를 가장 먼저 분석해야 한다. 현행 계획정비가 고장을 얼마나 방지하는지, 이로 인한 예산 절감효과가 어느 정도인지 분석해야 새로운 정비정책이나 산업체 운영정책을 결정할 수 있기 때문이다.

이를 위한 본 연구는 크게 5장으로 구성되었다. 제2장에서는 해군 함정의 엔진 고장 데이터를 확인하고, 고장확률에 대한 사전분포를 도출한다. 또 함정 승조원들을 대상으로 설문조사를 수행하여 엔진 정비효과에 대한 사전분포로 도출한다. 제3장에서는 사전분포들을 데이터와 적합시키기 위한 베이지안 모델을 구축하고 모델의 타당성을 진단한다. 제4장에서는 베이지안 추정 결과를 확인하고, 제5장에서 연구의 결과들을 종합하여 향후 연구방향 및 연구의 한계를 제시한다.


2. 고장확률과 정비효과에 관한 사전분포 도출

데이터는 2009 ~ 2019년에 해당하는 99척의 해군 전투함의 추진용 엔진 데이터이다. 99척의 데이터를 엔진 수명에 따라 재정렬하여 연차별 평균 고장량을 도출하였다. 연차별 평균 고장량으로부터 실제 고장확률에 대한 사전분포를 도출하였다. 실제 해군 엔진을 운용하고, 정비하는 승조원들을 대상으로 설문을 조사하였다. 승조원들은 장비의 상태저하를 판단하고 정비를 요청한다. 이때 요청한 정비량 대비 정비부대에서 수행한 정비량이 얼마나 되는지에 대한 설문에 응답하였다. 승조원들의 응답 데이터를 사전분포로 설정하였다.

2.1 해군 함정 고장 데이터와 고장 분포

Choi et al.(2021)의 확률 기반형 정비에는 해군 함정 엔진의 고장 데이터가 활용되었다. Yoo et al.(2019)은 SNA(Social Network Analysis)와 코사인 유사도를 기반으로 함정 엔진의 정비 경향을 분석하였다. 이들은 분석 결과를 통해 획득 시기가 비슷한 함정의 정비경향이 유사하다고 주장하였다. Moon and Choi(2021)는 계층형 베이지안 모델로 분석된 함정 엔진간 고장함수의 유사도(유클리디안 거리 분석)를 분석하였으며, 시기가 비슷한 엔진들의 고장함수간 유사도가 높다고 주장하였다. 또한 함정 엔진은 수명에 따른 고장추세가 모두 유사하였다. 즉, 해군 함정 엔진의 고장은 수명에 따라 유사하게 발생하며, 특히 도입시기가 유사하면 고장 발생 경향이 더욱 비슷하다고 할 수 있다. 본 연구의 엔진 고장 데이터를 <Figure 1>과 같이 수명에 따라 정렬하였다.

Figure 1.

Existing Data by Age and Engine Type

<Figure 1>에서 색으로 표시된 부분은 데이터가 존재하는 부분이다. 본 연구에서는 군사용 데이터의 보안 문제로 데이터의 실제값을 표기하지 않고, 비율 조정된 값을 사용한다. 고장 데이터에는 5가지 엔진 타입이 포함되며, 엔진의 타입이 다르면 함정의 타입이 다르다. 함정은 타입에 따라 도입시기가 다르다. 데이터는 2009 ~ 2019년에 해당하는 고장 데이터이나, 도입시기가 모두 다르기 때문에 수명별로 정렬하면 <Figure 1>과 같이 수명에 따른 고장발생의 위치가 다르다. 엔진의 수명은 대략 31년이다. 수명별 고장 특성은 수명별 고장량의 평균으로 <Figure 2>와 같이 나타낼 수 있다.

Figure 2.

Average of Failures by Age

<Figure 2>는 <Figure 1>의 99척의 수명별 평균 고장량을 도식화한 것이다. 수명 5 ~ 30년의 형태는 과거의 연구에서 알려진 욕조형태와 유사하다. 최초 5년간은 고장량이 증가한다. 이는 데이터 부재의 영향으로 보인다. 해군 함정은 도입 후 장비에 따라 몇 년간 조선소에 하자수리를 맡긴다. 하자수리에 관한 데이터는 본 연구의 데이터에 포함되어 있지 않다. 본 연구의 데이터는 군에서 직접 정비한 항목에 한한다. 최초 5년간의 고장량에는 하자 정비량이 제외되어 있으므로 실제보다 작게 표현되었다고 할 수 있다.

본 연구에서는 수명별 고장량의 분포를 바탕으로 베이지안 사전분포를 도출한다. 실증적 베이지안(Empirical Bayesian) 추정에서 사전분포의 설정은 최종 분포 형태를 분석가가 판단하여 결정할 수 있다. <Figure 2>에 도식화된 수명별 평균 고장량 데이터들의 평균은 33.8, 표준편차 16.9이다. 이를 사전분포로 변환하기 위해 Cullen and Frey 그래프를 이용하여 적절한 분포의 형태를 확인하였다. Cullen and Frey 그래프는 입력된 데이터의 왜도(skewness)와 첨도(kurtosis) 분석으로 통해 유사한 분포들의 후보를 시각적으로 제공한다. <Figure 3>는 수명별 고장량 데이터들을 Cullen and Frey 그래프로 나타낸 것이다. <Figure 3>에서 고장량 데이터(Observation)들 자체는 특정 분포에 속하는 부분이 없다. 이런 경우 bootstrap으로 생성한 가상의 데이터들을 바탕으로 그래프 상에서 가장 가까운 분포를 택할 수 있다. <Figure 3>의 bootstrap 데이터(bootstraped values)들은 정규(normal), 감마(gamma), 와이블(weibull), 로그정규분포(lognormal) 주변에 고밀도로 분포되어 있으므로 이들을 사전분포의 후보로 선정하였다. 베타분포(beta)는 표현범위내 포함되는 bootstrap 데이터가 많으나, 분포범위 내에서 광범위하게 퍼져있어 특정 모수(고밀도 지점) 추정에 적합하지 않을 것이라 판단하여 후보 사전분포에서 제외하였다. AIC(Akaike Information Criterion) 비교결과 정규분포의 AIC값이 264.81로 와이블(266.29), 감마(267.16), 로그정규(272.1)보다 작았다. AIC는 모델의 예측 에러를 평가하는 방법으로 모델 비교(model selection)에 사용된다. 따라서 수명별 고장량의 사전분포를 정규분포로 정하였다. 정규분포의 MLE(Maximum likelihood estimate) 적합 결과 normal(33.8,16.9)이 가장 적합하다. 단, normal(33.8,16.9)은 데이터에 최적합된 분포이므로 강정보 사전분포(Strongly prior) 가 된다. 강정보 사전분포는 데이터의 분포에 강하게 적합되기 때문에 새로운 정보의 반영이 힘들다(Gajewski et al., 2008; Zhang and Long, 2010; Jiang et al., 2015). 반면 약정보 사전분포(Weakly prior)는 데이터에 포함되지 않은 새로운 데이터에 대해 상대적으로 유연하게 가능성을 반영할 수 있다(Gelman et al., 2013). 새로운 데이터의 발생 가능성과 일반성을 고려하여 약정보 사전분포를 사용하였다. 본 연구에서는 표준편차를 크게 조정(16.9에서 20으로 상향 조절)하여 약정보 사전분포의 효과를 반영하였다. <Figure 4>와 같이 normal(33.8,20)를 고장확률에 관한 사전분포로 도출하였다. <Figure 4>의 사전분포의 범위는 0 이하를 포함하지 않는다. 사전분포는 확률분포로서 합이 1인 분포의 형태가 적용되어야 한다. 단, 본 연구에서 수행하는 베이지안 통계 언어 Stan은 샘플이 추출되는 범위를 입력받고 내부 알고리즘을 통해 합이 1인 확률분포와 같은 형태로 연산가능하도록 변환된다. 즉, <Figure 4>와 같이 사전분포로 지정된 영역의 합이 1보다 작아도 베이지안 추정이 가능하다. Stan을 이용한 모델구축은 제3장에서 설명한다.

Figure 3.

Cullen and Frey Graph of Failure Ratio

Figure 4.

Prior distribution of failure ratio

2.2 엔진 정비효과 도출을 위한 설문조사

해군에서 정비는 일반적으로 완전정비와 불완전 정비로 구분한다. 완전정비는 고장개소를 완전히 정비하여 고장 이전의 상태로 되돌리는 것이다. 불완전 정비는 고장개소를 정비하여 작동 가능한 상태로 복구하였으나, 고장 이전의 상태보다는 성능이 떨어지는 정비이다. Shin et al.(1996)은 정비효과를 GAN(Good as new)와 BAO(Bad as old)로 구분한다. GAN, BAO는 각각 완전정비와 불완전 정비에 해당한다. 이들은 Malik(1979)가 주장한 PAR(Propotional age reduction)를 바탕으로 정비를 거듭할수록 정비효과에 따라 장비가 노후된다고 주장하였다. 단, GAN, BAO의 파라미터 추정에 있어 수리적 방식을 택하여 많은 시뮬레이션이 불가하므로 최적의 파라미터를 도출하였다고 보기는 어려웠다. Xu et al.(2021)은 상태기반정비(Condition based maintenance)를 마코프 의사결정 프로세스(Markov decision process) 기반으로 최적화하였다. 이 연구의 최적화 목적식은 정비효과보다는 경제적인 효율성에 집중되어 있다. 최근의 연구 동향은 정비를 통한 예산의 최적화에 초점이 맞춰지는 경향이 있었다. 반면 군의 초점은 정비예산의 효율적 사용보다는 고장개소의 완전한 정비에 맞춰져 있다고 할 수 있다. 함정 엔진의 불완전한 정비는 임무수행 실패로 이어지고, 이로 인한 손실은 가늠할 수 없을 만큼 크기 때문이다.

한편 정비효과는 수치적으로 명확하게 계산하기 힘들다. 고장개소가 정비되었을 때 정격성능을 발휘하는 장비라도 내부적인 피로결함이 누적되고 있을 수 있기 때문이다. 축회전수 1,800rpm으로 1시간 이상 유지할 수 있을 때 정격성능을 발휘한다고 판단하는 엔진의 경우를 예를 들 수 있다. 이 엔진의 신품은 1,800rpm으로 2시간을 유지한다고 가정해보자. 정격성능을 발휘 중인 엔진은 1시간 10분을 유지할 수도 있고, 2시간을 유지할 수도 있다. 다시 말하면, 정비 후 엔진의 실제 성능은 새것과 같을 수도 있고, 다소 저하되어 있을 수도 있지만 모두 정격성능을 발휘하는 엔진에 포함된다. 실제 엔진의 운용자만이 정비된 엔진의 실제 성능을 파악할 수 있다. 엔진의 운용자들은 성능이 저하된 모든 부분에 대해 정비부대에 정비를 요청한다. 정비부대의 담당자는 함정에 승조하여 요청된 정비개소를 확인하여 정격성능 이하인지 여부를 별도로 확인한다. 정비부대에 입고된 함정은 승조원이 요청한 모든 부분에 대한 정비를 수행한다. 해군 엔진의 고장 데이터는 엔진 운용자가 고장개소를 포함하여 성능저하 의심 개소들에 대해 정비를 요청한 기록이다. 그러므로 데이터 값은 정격성능을 만족하지만 성능이 다소 저하된 부분을 포함한다고 할 수 있다. 정비효과에 관한 베이지안 사전분포는 찾고자하는 모수(정비효과)가 어떤 범위에 있을 것인가에 대한 믿음이라고 설명할 수 있다. 다시 말하면, 새것과 같은 상태가 되는 완전정비를 100% 정비라고 할 때 부대정비로 몇 % 복구할 수 있는가에 대한 엔진 운용자의 믿음이 사전분포가 된다. 엔진의 정비효과에 대한 사전분포를 구성하기 위해 설문조사를 수행하였다.

설문은 한국 해군의 000급 000함 등 3척과 육상에 근무 중인 내연기관 담당자 19명을 대상으로 수행하였다. 피설문자들은 해군에 입대함과 동시에 엔진의 정비와 관리만을 수행하는 전문가들이다. 피설문자들의 업무 경력은 <Table 1>과 같다.

Experience in Engine Management

승조원이 정비 신청을 하면 정비부대 담당자가 함정에 승조하여 고장개소를 식별하고, 정비를 수행하게 된다. 따라서 설문조사는 다음의 2가지로 구분되어 수행되었다.

  • ① 정비부대 담당자가 실제 성능저하 개소 대비 몇 %의 정비개소를 식별하는가.
  • ② 정비부대에서 식별된 정비개소를 정비하였을 때 몇 %의 완전정비를 수행하는가.

각 항목에 대한 응답 결과의 수는 <Table 2>와 같다.

Survey Results

설문항목 ①, ②는 정비효과에 동시 영향을 미친다. 식별된 정비개소가 80%이고, 식별된 정비개소에서 수행한 정비율이 80%라고 한다면 정비효과는 64%(0.8 × 0.8)가 된다. 즉, 설문항목 2가지에 대한 곱의 경우의 수 361개(19 × 19)가 정비효과에 사전분포 데이터가 된다. <Figure 5>의 Cullen and Frey 그래프에서 bootstrap 데이터들은 고장확률에 관한 사전분포(<Figure 3>)와 달리 bootstrap 데이터가 여러 분포에 걸쳐 분산되지 않는다. 또한 모든 데이터가 베타분포의 범위에 포함된다. 따라서 베타분포를 사전분포로 선정하였다. MLE 추정결과 beta(4.61,2.90)가 적합였으나, 약정보 사전분포 효과를 위해 Fig.6과 같이 beta(5,4)로 수정 적용하였다. 설문 데이터의 최소값은 0.42였다. 따라서 정비효과의 최소값이 0.42 이하일 가능성은 매우 낮을 것이라 판단하였다. 제2.1절과 같이 Stan을 활용하여 x를 0.42 이상인 범위로 제한하였다.

Figure 5.

Cullen and Frey Graph of Maintenance Effect

Figure 6.

Prior Distribution of Maintenance Effect


3. 모델링

제2.1, 제2.2절에서 언급한바와 같이 모델의 구축에는 베이지안에 최적화된 통계 언어 Stan을 활용하였다. Stan은 분포의 샘플링 알고리즘에 MCMC(Monte carlo markov chain)의 일종인 HMC(Hemiltonian monte carlo)를 사용한다. HMC는 이전의 깁스(Gibbs) 샘플러와 같은 방법보다 빠르고, 강건한 수렴이 가능하다. 또한 수렴진단에 대한 자체적인 알고리즘을 보유하여 모델의 타당성(이상 유무)을 즉각적으로 확인할 수 있다는 장점이 있다(Betancourt and Girolami, 2015; Carpenter et al., 2017).

maintenanceratiobeta5,4failurerationormal33.8,20completeratea=Ya*maintenanceratioincompleteratea=Ya*1-maintenanceratioyearlyratea=Ya-incompleteratea-1E1=6,000Ea=Ea-1-incompleteratea-1YanormalEa*failureratio,σ(1) 

<Figure 7>의 고장과 정비의 절차에 따라 베이지안 모델의 수식을 구성하였다. 고장이 발생한 부품은 완전 정비되거나, 불완전 정비된다. 정비량에 따라 고장 부품수(failure rate)와 정상작동 부품수가 산출되며, 정상 작동 부품에서는 다시 고장이 발생할 수 있다. 제2장에서 도출한 2가지의 사전분포와 함께 해군의 엔진 데이터를 활용한 베이지안 모델을 식 (1)과 같이 구축하였다. ‘failure ratio’, ‘maintenance ratio’는 각각 고장확률과 정비효과에 관한 사전 확률분포이다. ‘complete rate’는 연간 고장량 중 완전 정비된 고장건수이다. ‘incomplete rate’는 반대로 불완전 정비된 고장건수이다. 6,000은 엔진의 총 부품수에 해당한다. 내연기관의 부품은 일반적으로 약 6,000개의 부품으로 이루어져 있다. 식 (1)에서 E1은 수명 1년차에 정상작동중인 부품의 수이므로 6,000이다. Ea는 a년차에 정상작동중인 부품수가 된다. 고장의 발생은 모델의 우도함수가 되며, 정규분포를 따른다고 가정하였다. Ea* failure ratio는 a년도의 평균 고장발생량이다. a년도에 정상 작동하는 부품수(Ea)는 a-1년도 정상 작동하는 부품수(Ea-1)에서 고장 후 불완전 정비된 부품수(incomplete ratea-1)를 뺀 것이다. a년도의 정상 작동하는 부품수(Ea)에 고장확률(failure ratio)를 곱하면 a년도의 고장량(Ya)가 된다. 고장량의 데이터는 2.2절과 같이 정규분포를 따른다고 가정하였다. Stan에서 사전분포의 모수를 별도로 지정하지 않으면, 무정보 사전분포(non-informative prior)로 적용된다. 모델에서 우도함수 σ는 별도로 지정하지 않았다. 이때 우도함수의 σ는 무정보 사전분포로 적용되어 HMC 샘플링에서 모수 공간을 충분히 탐색하게 된다(Syversveen, 1998).

Figure 7.

Maintenance Process

베이지안 모델의 진단은 HMC 체인의 수렴여부로 판단할 수 있다. <Figure 8>는 고장발생 확률에 대한 HMC 체인의 발산(divergence)정도를 테스트한 것이다. x축은 엔진의 각 수명이고, y축은 고장발생 확률이다. 검정색 얇은 선은 수렴한 샘플이고, 주황색 선은 수렴하지 못한 샘플에 해당된다. 4개의 체인을 설정하여 HMC를 수행하였으며, 샘플 중 0.35%(14/4000)가 수렴하지 않았다. 한편 <Figure 9>의 사후 예측분포(posterior predictive check)는 모델의 사후분포를 이용하여 도출된 임의의 샘플을 추출하여 관측 데이터와의 일치성을 시각적으로 확인한다. 파랑색 얇은 선들은 모델에서 추출된 샘플들이고, 검정색 선이 관측된 데이터에 해당한다. 일반적으로 샘플들에 해당하는 파랑색 선들이 모여 구성된 면적 내에 관측 데이터가 있으면 모델을 타당하다고 판단한다. 또, 모든 모수들의 R-hat은 1.1 이하였다. R-hat은 HMC 체인들간의 수렴과, 분산을 진단하는 수치로 1.1 이하가 권장된다(Betancourt, 2016). BFMI(Bayesian fraction of missing information) 값은 0.3 이상으로 각 체인이 모델을 충분히 설명하고 있다. 각 진단방법에 관한 자세한 내용은 Vehtari and Lapinen(2020)을 통해 확인할 수 있다. Carpenter et al.(2017)은 모든 샘플이 수렴할 때까지 모수를 수정해보길 권장한다. 본 연구에서는 Fig.8과 같이 일부 수렴하지 않은 샘플이 있으나, 그 정도가 작고(0.35%) 다른 진단들에는 이상 없으므로 모델은 타당성을 가진다고 판단하였다.

Figure 8.

Divergence Test of Failure Ratio

Figure 9.

Posterior Predictive Check


4. 결과분석

베이지안 추정 결과 고장확률과 정비효과에 대한 사후분포가 도출되었다. 또한, 식 (1)을 통해 고장확률과 정비효과로부터 연간 발생 고장량, 완전 정비량, 불완전 정비량이 계산되었다. 엔진을 구성하는 6,000개의 부품이 각각 독립적이라고 가정하여 총 수명주기 동안 발생하는 고장량을 도출할 수 있다. 수명별 고장량과 정비량 분석을 통해 해군의 계획정비가 예방(PM, preventive maintenance)의 효과보다 수정(CM, corrective maintenance)의 효과에 가깝다는 것을 추정할 수 있다.

4.1 정비효과와 고장확률의 사후분포

HMC 샘플링을 통해 정비효과와 고장확률의 사후분포를 도출하였다. <Figure 10>은 정비효과(maintenance ratio)의 사후분포이다. <Figure 6>에서 정비효과의 사전분포는 x축 0.42 이상의 범위에서 beta(5,4)의 분포를 보인다. 사후분포는 데이터의 영향으로 형태가 변경(shrinkage)되어 평균 0.73의 정규분포와 유사한 형태가 추정된다. 94% 고밀도 구간(High density interval)은 0.67 ~ 0.79이다. 함정 엔진을 운용하고 정비하는 담당자들은 상태가 저하된 부분과 고장난 개소에 대해 정비부대에 정비를 의뢰한다. 정비부대에서는 이를 식별하고 정비한다. 군은 일반적으로 계획정비를 100% 완전정비라고 가정하나, 사후분포 추정결과 73% 수준의 효과가 있었다. 고장개소는 정격 이하의 성능이거나, 운용불가 개소이므로 식별이 비교적 쉽고 정비효율이 높을 것으로 보인다. 반면 정격성능 이상의 상태저하 개소는 운용자들의 감각에 의해 발견되는 경향이 크다. 운용자들이 정비를 요청하여도 정비부대에서 이를 정확히 식별하지 못할 가능성이 크다. 운용자들은 실제로 함정 엔진에 부하를 주어 작동시키면서 장비 상태를 점검할 수 있으나, 정비부대 담당자들은 실제로 운용하며 확인할 수 있는 시간이 짧다. 그러므로 정비부대 담당자들은 상태 저하개소 식별이 쉽지 않다. 군의 기대와 달리 정비효과가 73%에 미친 것은 이와 같은 이유라고 할 수 있다. 27% 차이는 작은 차이라고 할 수 없다. 왜냐하면, 27%의 미 정비개소가 다음연도의 상태 저하개소가 되거나, 큰 고장으로 이어질 수 있는 위험을 가지기 때문이다. 27%의 성능저하 개소 중 정격성능 유지 불가시 장비 작동이 불가한 부품이 있다면 이는 큰 문제로 이어진다. 정격성능을 유지하지 못하는 장비로 인해 작전 임무에 실패할 수 있기 때문이다. 경제적인 최적 정비를 수행하는 일반 산업체와 달리 군은 이러한 이유로 완전정비를 추구한다. 정비부대는 27%의 상태저하 개소 식별능력을 키우기 위한 방안을 마련할 필요가 있다.

Figure 10.

Posterior of Maintenance Ratio

<Figure 11>의 failure_ratio 0 ~ 30은 연차별 고장발생 확률의 사후분포이다. 사후분포의 평균은 최소 0.0059 ~ 최대 0.052까지 분포되어 있다. 6,000개의 엔진 부품을 고려하였을 때 최소 36개(6,000*0.0059)의 부품에서 최대 312개(6,000*0.052)의 부품이 연간 상태가 저하되거나, 고장이 발생할 수 있다는 의미이다. 연차별 고장확률들의 사후 평균값 주변에는 94% 고밀도 구간이 분포되어 있다. 이는 사전분포와 데이터를 고려하여 HMC에서 샘플링 될 수 있는 사후분포의 공간이 된다. <Figure 12>는 <Figure 10>과 <Figure 11>의 사후분포 공간을 고려한 고장량의 발생 가능범위이다. 즉, 고장확률과 정비확률에 관한 사후분포 모수들을 활용하였을 때 나타날 수 있는 고장량의 범위이며, 이는 수명별 고장량의 예측범위(predicted failure rate)가 된다. 고장량은 연차별 고장확률과 그 해의 정상 작동중인 부품수의 곱이다. 고장량은 정비확률에 따라 완전 정비되거나, 불완전 정비되어 다음해의 고장량에 포함된다.

Figure 11.

posterior of failure ratio by year

Figure 12.

Predicted Failure Rate

<Figure 12>는 <Figure 7>에서 표현한 고장과 정비의 순서에 사전분포 대신 사후분포를 적용하여 샘플링한 결과로 볼 수 있다. 즉, <Figure 12>는 연차별 고장날 가능성이 있는 부품수를 수명에 따라 나타낸 것이 된다. 사후분포를 고려한 평균적으로 연차별로 발생할 수 있는 고장량이 파란선인 예측 고장량(predicted failures)가 된다. 엔진 고장 데이터인 빨간선과 사후분포에서 샘플링한 평균값인 파란선이 거의 일치하는 것은 Fig.9의 사후 예측분포 범위 내에 관측값들이 있는 것과 같은 맥락으로 이해할 수 있다. 하늘색으로 표현된 94% 고밀도 구간을 통해 연간 엔진의 고장량의 범위를 추정할 수 있다.

4.2 정비효과 분석

식 (1)에 따라 정비효과와 고장확률의 사후분포로부터 연중 발생하는 고장량(Yealy rate), 완전 정비량(Complete rate), 불완전 정비량(Incomplete rate)의 사후분포를 <Figure 13>과 같이 도출하였다. <Figure 11>의 고장확률에 따라 총수명동안 고장량은 변한다. 정비효과(<Figure 10>)에 따라 고장량이 많을 때는 정비량과 불완전 정비량도 같이 증가한다. <Figure 13>에서 완전 정비량(complete rate)과 연중 발생하는 고장량(yearly rate)의 추이는 유사하다. 총 수명주기의 대부분 근소한 차이로 연중 발생 고장량이 큰 값을 보인다. 연중 발생하는 고장량은 본 연구에서 도출하고자 했던 정비효과가 제거된 고장 발생량이 된다. 연간 발생한 고장에 대해 정비를 수행하나, 불완전 정비로 인해 다음해에는 순수하게 발생한 고장보다 많은 정비를 수행해야 한다. 이는 총수명동안 반복된다. 관측값(observed failure rate)은 완전 정비량과 불완전 정비량의 합과 일치한다. 제4.1절에서 정비효과의 사후평균이 73%인 것에 대해 정비자들은 운용자만큼의 실제 엔진 상태를 알기 힘들기 때문이라고 하였다. 계획정비가 종료될 때 정비부대에서는 함정의 모든 장비가 정격성능 이상을 발휘하는지 확인한다. 이런 시운전 과정을 통과하지 못하면 작전임무에 투입되지 못한다. 따라서 계획정비가 종료된 함정은 모든 장비와 부품이 정격성능 이상을 발휘한다고 할 수 있다. 그럼에도 불구하고 정비효과의 사후평균이 73%라는 것은 정격 이하부분에 대해서는 완전정비를 수행하지만, 정격성능 이상의 상태 저하 부분에 대해서는 정비를 하지 못한다는 의미로도 해석 가능하다. 다시 말하면 부대정비에서는 정격성능 이상의 상태저하 부분에 대한 정비는 수행하지 못하고, 정격성능 이하로 판단되는 부분에 대해서만 정비를 수행한다고 볼 수 있다. 이는 다시 엔진 운용자가 판단한 100의 상태저하 부품 중 정격성능을 발휘하지 못하는 부분은 약 73%이고, 이들에 대해서 정비를 수행한다고 할 수 있다. 즉, 부대정비는 예방정비(preventive maintenance)보다는 고장정비(corrective maintenance)에 가깝다.

Figure 13.

Prediction of Failure Related Values


5. 결 론

해군은 현재까지 고수 중인 기간 고정형 정비의 개선방안을 찾기 위해 노력중이다. 군은 보안상의 이유로 데이터를 장기간 보관하지 않는다. 이는 총수명주기 기반의 정비제도 도출에 악영향을 미친다. 또한 정확한 정비능력에 대한 정량적 측정이 이루어지지 않아 계획정비의 기간 측정도 쉽지 않다. 이는 군만이 가진 특수한 문제는 아니다. 일반 산업체들의 장비들도 주기적인 정비를 수행하고 있으나, 정비의 효과가 어떤지에 대한 측정은 수행하지 않기 때문이다. 정비효과의 도출은 이와 같은 부분에 있어 정비 정책 결정에 중요한 역할을 할 수 있다. 본 연구에서의 정비효과는 실제 기록된 데이터를 바탕으로 이루어졌다. 승조원들의 전문지식이 사전분포로 포함되어 해군 데이터에 적합한 분석을 하였다고 할 수 있다. 군의 정책 결정시 정비의 효과는 100%라고 가정하지만, 베이지안 추정 결과는 평균 73% 정도에 그쳤다. 또한 연간 고장확률이 0.0059 ~ 0.052까지 크게 변한다는 것은 총수명 동안 고장확률이 실제로 다르고, 고장함수의 군 반영이 시급함을 시사한다.

다만 본 연구는 다음과 같은 한계가 있어 이를 해결하기 위한 더욱 심도있는 연구가 필요하다. 먼저 데이터가 충분하지 않다. 연차별로 나열하고 고장의 평균을 기준으로 베이지안 추정을 수행했으나, 연차별 데이터의 수가 모두 다르기 때문에 정확성을 높이기 위해 더 많은 데이터를 활용할 필요가 있다. 두 번째, 베이지안 추정 후 여러 가지 타당성 검증을 수행하였으나, 발산성 검정에서 0.35% 발산이 확인되었다. 비록 작은 양의 발산이나, 타당성을 높이기 위해서는 모수 수정을 통해 발산하는 샘플이 없도록 조절되어야 한다. 마지막으로 설문의 양이 부족하다. 설문 대상자들이 엔진만을 다루는 전문가였음에도 느끼는 정비효율의 범위가 다양하였다. 따라서 보다 많은 대상자에게 설문을 수행하여 정교한 사전분포를 도출해야 한다.

References

  • Betancourt, M. and Girolami, M. (2015), Hamiltonian Monte Carlo for hierarchical models, Current Trends in Bayesian Methodology with Applications, 79(30), 2-4. [https://doi.org/10.1201/b18502-11]
  • Betancourt, M. (2016), Diagnosing suboptimal cotangent disintegrations in Hamiltonian Monte Carlo, arXiv preprint arXiv:1604.00695, .
  • Carpenter, B., Gelman, A., Hoffman, M. D., Lee, D., Goodrich, B., Betancourt, M., and Riddell, A. (2017), Stan: A probabilistic programming language, Journal of Statistical Software, 76(1), 1-32. [https://doi.org/10.18637/jss.v076.i01]
  • Choi, J.-W., Moon, H.-J., and Jo, W.-Y. (2020), Preventive Maintenance Interval Optimization based on Lifecycle Failure Prediction, Korean Journal of Logistics, 28(6), 57-70.
  • Choi, J.-W., Moon, S.-A., and Jo, W.-Y. (2021), A Study on the Probability-Based Planned Maintenance Effectiveness of Naval Combat Ships, Journal of Korea Institute of Industrial Engineers, 47(2), 190-198. [https://doi.org/10.7232/JKIIE.2021.47.2.190]
  • Gajewski, B. J., Simon, S. D., and Carlson, S. E. (2008), Predicting Accrual in Clinical Trials with Bayesian Posterior Predictive Distributions, Statistics in Medicine, 27(13), 2328-2340. [https://doi.org/10.1002/sim.3128]
  • Gelman, A. (2006), Multilevel(hierarchical) modeling: What it can and cannot do, Technometrics, 48(3), 432-435. [https://doi.org/10.1198/004017005000000661]
  • Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., and Rubin, D. B. (2013), Bayesian data analysis, Chapman and Hall/CRC, New York. [https://doi.org/10.1201/b16018]
  • Jiang, Y., Simon, S., Mayo, M. S., and Gajewski, B. J. (2015), Modeling and Validating Bayesian Accrual Modelson Clinical Data and Simulations Using Adaptive Priors, Statistics in Medicine, 34(4), 613-629. [https://doi.org/10.1002/sim.6359]
  • Malik, M. A. K. (1979), Reliable Preventive Maintenance Scheduling, AIIE Transactions, 11(3), 221-228. [https://doi.org/10.1080/05695557908974463]
  • Moon, H. and Choi, J. (2021), Hierarchical Spline for Time Series Prediction: An Application to Naval Ship Engine Failure Rate, Applied AI Letters, 2(1), e22. [https://doi.org/10.1002/ail2.22]
  • ROK NAVY, (2018), Ship’s Maintenance System, 9-10.
  • Sherbrooke, C. C. (2006), Optimal Inventory Modeling of Systems: Multi-echelon Techniques (Vol. 72), Springer Science & Business Media, Stanford University.
  • Shin, I., Lim, T. J., and Lie, C. H. (1996), Estimating Parameters of Intensity Function and Maintenance Effect for Repairable Unit, Reliability Engineering & System Safety, 54(1), 1-10. [https://doi.org/10.1016/S0951-8320(96)00097-X]
  • Syversveen, A. R. (1998), Noninformative bayesian priors, Interpretation and Problems with Construction and Applications, Preprint Statistics, 3(3), 1-11.
  • Taieb, S. B., Yu, J., Barreto, M., and Rajagopal, R. (2017), Regularization in hierarchical time series forecasting with application to electricity smart meter data, In Proceedings of the AAAI Conference on Artificial Intelligence, 31(1).
  • Taylor, S. J. and Letham, B. (2018), Forecasting at scale, The American Statistician, 72(1), 37-45. [https://doi.org/10.1080/00031305.2017.1380080]
  • Thibodeau, R. and Dodson, E. N. (1979), Life Cycle Phase Interrelationships, Journal of Systems and Software, 1, 203-211. [https://doi.org/10.1016/0164-1212(79)90021-9]
  • Vehtari, A. and Lampinen, J. (2002), Bayesian Model Assessment and Comparison Using Cross-Validation Predictive Densities, Neural Computation, 14(10), 2439-2468. [https://doi.org/10.1162/08997660260293292]
  • Wang, J. and Yin, H. (2019), Failure Rate Prediction Model of Substation Equipment Based on Weibull Distribution and Time Series Analysis, IEEE Access, 7, 85298-85309. [https://doi.org/10.1109/ACCESS.2019.2926159]
  • Xu, J., Liang, Z., Li, Y. F., and Wang, K. (2021), Generalized Condition-based Maintenance Optimization for Multi-component Systems Considering Stochastic Dependency and Imperfect Maintenance, Reliability Engineering & System Safety, 211, 107592. [https://doi.org/10.1016/j.ress.2021.107592]
  • Yoo, J.-M., Yoon, S.-W., and Lee, S.-H. (2019), SNA-based Trend Analysis of Naval Ship Maintenance, Journal of the Korea Society of Computer and Information, 24(6), 165-174.
  • Zammori, F., Bertolini, M., and Mezzogori, D. (2020), A Constructive Algorithm to Maximize the Useful Life of a Mechanical System Subjected to Ageing, with Non-resuppliable Spares Parts, International Journal of Industrial Engineering Computations, 11(1), 17-34. [https://doi.org/10.5267/j.ijiec.2019.7.001]
  • Zhang, X. and Long, Q. (2010), Stochastic Modeling and Prediction for Accrual in Clinical Trials, Statistics in Medicine, 29(6), 649-658. [https://doi.org/10.1002/sim.3847]
저자소개

최진우: 최진우는 해군사관학교 전산과학과에서2009년 학사, 국방대학교에서 2019년 국방관리학과 석사학위를 취득하고 박사과정에 재학중이다. 연구분야는 Failure function, Bayesian statistics이다.

문성암: 문성암은 연세대학교 경영학과에서 92년 학사, 94년 석사, 99년 박사학위를 취득하였다. 현재 국방대학교 국방관리학과 교수로 재직 중이며, 안보문제연구소 국방관리센터장, 국방부 정책자문위원, 로지스틱스 학회 및 생산관리학회 부회장을 겸임하고 있다. 연구분야는 Behavior Operational Management, Supply Chain Management이다.

Figure 1.

Figure 1.
Existing Data by Age and Engine Type

Figure 2.

Figure 2.
Average of Failures by Age

Figure 3.

Figure 3.
Cullen and Frey Graph of Failure Ratio

Figure 4.

Figure 4.
Prior distribution of failure ratio

Figure 5.

Figure 5.
Cullen and Frey Graph of Maintenance Effect

Figure 6.

Figure 6.
Prior Distribution of Maintenance Effect

Figure 7.

Figure 7.
Maintenance Process

Figure 8.

Figure 8.
Divergence Test of Failure Ratio

Figure 9.

Figure 9.
Posterior Predictive Check

Figure 10.

Figure 10.
Posterior of Maintenance Ratio

Figure 11.

Figure 11.
posterior of failure ratio by year

Figure 12.

Figure 12.
Predicted Failure Rate

Figure 13.

Figure 13.
Prediction of Failure Related Values

Table 1.

Experience in Engine Management

구 분 경력(년)
0 ~ 3 3 ~ 5 5 ~ 10 10 ~ 15 15 ~ 20 20 이상
피설문자(명) 2 5 5 3 3 1 19명

Table 2.

Survey Results

설문항목 응답범위(%)
60 ~ 70 70 ~ 80 80 ~ 90 90 ~ 100
- 10 3 6
5 5 6 3