Journal of the Korean Institute of Industrial Engineers
[ Original Research ]
Journal of the Korean Institute of Industrial Engineers - Vol. 47, No. 2, pp.130-143
ISSN: 1225-0988 (Print) 2234-6457 (Online)
Print publication date 15 Apr 2021
Received 23 Oct 2020 Revised 02 Feb 2021 Accepted 03 Feb 2021
DOI: https://doi.org/10.7232/JKIIE.2021.47.2.130

시뮬레이션 데이터 생성을 통한 기계학습 기반 원자로 노심 이상 탐지 방법론

오용경1 ; 김한주2 ; 이덕중2 ; 김성일1,
1울산과학기술원 산업공학과
2울산과학기술원 원자력공학과
Simulation-based Anomaly Detection in Nuclear Reactors
YongKyung Oh1 ; Hanjoo Kim2 ; Deokjung Lee2 ; Sungil Kim1,
1Department of Industrial Engineering
2Department of Nuclear Engineering

Correspondence to: 김성일 교수, 44919 울산광역시 울주군 유니스트길 50 울산과학기술원 산업공학과, Tel : 052-217-3195, Fax : 052-217-6809, E-mail : sungil.kim@unist.ac.kr

© 2021 KIIE

Abstract

Anomaly Detection in the nuclear reactor is a crucial technology to prevent malfunctions or unplanned shutdowns and to enhance efficient operations. Despite its importance, it remains at the level of relying on rule-based diagnostic or expert judgment due to the lack of training data. It is challenging to obtain real data from the nuclear reactor because of safety and security issues. To overcome those challenges, this paper proposes a new simulation-based anomaly detection methodology in nuclear reactors. We investigate assignable causes of abnormal behaviors in the nuclear reactor, generate simulation data using nuclear core analysis code, RAST-K, and apply the classification models for detecting abnormal behaviors. The proposed method is validated by the control rod positional anomalies simulation data generated by RAST-K.

Keywords:

Nuclear Reactor Simulation, Anomaly Detection, Ensemble-Based Approach

1. 서 론

원자력 발전소는 효율적인 관리와 설비의 고장 및 불시 정지를 예방하기 위하여 4차 산업혁명 기술을 적용한 온라인 통합 모니터링 및 예측 진단 시스템 구축이 요구되어 왔다. 이와 관련하여 한국수력원자력(이하 한수원)에서는 지난 10여 년간 신기술을 접목하여 이상 탐지를 위한 과제들을 진행해 왔다 (Kim, 2018). 1단계 과제로 2013년부터 2016년까지 24개 원자력발전소의 주요 계통과 설비를 통합 감시하기 위한 온라인 통합 모니터링 및 조기 경보 시스템을 구축하여, 현재 경주 본사 원전 종합상황실에서 24시간 운영을 통해 설비의 미세한 고장 징후를 사전에 예방하고 있다. 2단계 과제로 원자력발전소 주요 설비를 대상으로 온라인 자동 예측 진단 기술 개발을 2017년 8월에 착수하였으며, 2018년 2월 세계 최초로 원자력발전소 핵심 설비의 고장을 사전에 예측할 수 있는 예측 진단용 빅데이터 시스템을 구축하였다. 예측 진단용 빅데이터 시스템은 IoT(Internet of Thing) 기술을 활용 24개 발전소 별로 분산 운영 중인 감시/진단 시스템을 온라인으로 연계해 터빈, 냉각수 펌프 등 원전 핵심 설비를 통합 진단할 수 있는 인프라를 제공하게 된다. 2018년 12월에는 시범적으로 선정된 300대 설비에 대한 상태 감시 빅데이터와 AI 기술 기반 자동 예측진단 시스템을 성공적으로 구축하고, 빅데이터를 활용해 설비 결함 65건을 사전에 탐지해 발전소에 제공하는 등 성공적으로 시스템을 정착시켰다. 2019년 1월부터는 발전소 자동 예측진단 시스템을 전 원전 핵심설비 1만 5000대에 확대 적용하고 전력설비 열화상 딥러닝 기술과 무선센서를 적용한 설비 진단 등 관련 기술을 고도화하고 있다(Kim, 2018).

본 논문은 이러한 노력의 일환으로 기계학습 기반 원자로 노심 이상 탐지 방법을 제안한다. 기존의 발전소 이상 상태 진단은 감시 변수의 정상 운전값을 기준으로 정상 운전값에서 일정값 이상 벗어나면 경보를 발생시키는 설정치 기반 진단 기술인 것에 반해 본 논문은 인공지능과 패턴 학습 개념을 적용한 기계학습 기반 이상 탐지 기술을 제안한다. 이상 탐지는 각 감시 변수들의 정상 상태 운전 패턴을 사전 학습하고 유사 패턴 변수들을 그룹핑한 결과를 바탕으로 각 감시 변수들의 정상 상태 예측값을 계산하고 현장에서 측정되는 값과 실시간으로 신호 패턴을 비교하여 현장 측정값의 패턴이 예측값의 패턴을 벗어나는지 즉각 판단하게 된다. 이러한 이상 탐지는 기존 설정치 기반 진단 기술에 비해 설비의 미세한 이상 징후를 수 개월 또는 수 일 전에 찾아낼 수 있는 기술로 기존의 설정치 기반 경보 기술의 제한점을 보완할 수 있으며, 특히 원자력발전소의 경우 설비의 미세 이상 징후를 사전에 탐지하여 설비의 고장을 방지하고 정비 계획을 사전에 수립할 수 있어 비계획 정비에 의한 경제적 손실을 절감할 수 있는 장점이 있다.

본 연구의 학문적 기여점은 아래 세 가지로 요약할 수 있다.

첫째, 기존의 이상 상황 진단 기술의 한계를 극복하기 위하여, 기계학습 기반 원자로 노심 이상 탐지 방법을 제안하였다. 학습 데이터 생성부터 다양한 인공지능, 기계학습 기반 이상 탐지 모델들을 비교 평가에 이르기까지 일련의 과정을 제안하였다. 둘째, 높은 예측 성능을 가진 이상 탐지 모델을 개발하고 이를 학습시키기 위해서는 충분한 숫자의 학습 데이터가 필요하다. 하지만, 실제 원자로 노심 이상 상황을 재현하여 노심 운전 데이터를 수집하는 것은, 원자력발전소 안전성 문제, 비용 문제, 보안성 문제 등으로 인해 현실적으로 불가능하다. 이러한 문제를 해결하기 위하여 노심 설계 코드인 RAST-K를 활용하여 노심 정상 상황 및 이상 상황에 대한 운전 데이터를 생산하는 방법을 제안하였다. 셋째, 노심 운전 이상을 발생시키는 요인들에 대하여 분석하고, 그 중 제어봉 위치 편차 발생을 탐지하기 위하여 기존에 사용하던 제어봉 위치 신호와 함께 노심 노내 계측기 신호를 이용한 방법을 새롭게 제안한다. 제안된 방법은 앞에서 설명한 RAST-K를 활용하여 생산된 시뮬레이션 데이터를 통하여 검증하였다.

논문은 다음과 같이 구성되어 있다. 제 2장에서는 원자로 노심 운전 이상의 발생 요인에 대하여 분석하고 기존의 원자로 노심 이상 탐지 방법에 대해 논의한다. 제 3장에서는 RAST-K를 이용한 학습용 노심 운전 데이터를 생산하는 방법과 가정한 제어봉 위치 이상 노심 이상 상황에 대해 소개한다. 그리고 이상 탐지 모델에 대해 설명한다. 제 4장에서는 실험 설계와 그 결과를 정리하고, 제 5장에서 토론과 함께 논문의 결론을 맺는다.


2. 원자로 노심 운전 이상 발생 요인

통계적으로 이상 상태는 품질 변동의 결과로 설명할 수 있다. 품질 변동이 발생하는 요인은 크게 우연요인(Random cause)과 이상요인(Assignable cause)로 나눌 수 있다. 우연요인은 조정이 불가피한 작업환경의 변화, 식별 되지 않을 정도의 원자재 간의 차이 등과 같은 불가피한 원인에 의한 자연스러운 품질 변동의 요인이고, 이상요인은 우연요인 이외의 다른 변동(생산설비의 이상, 미숙련 작업원의 투입, 불량 자재 사용 등)에 의한 품질변동의 요인이다(Montgomery, 2007). 우연요인에 의한 이상 상황은 여러가지 우연요인들이 복합적으로 연결된 경우가 많아 분석하기 어렵고, 품질변동을 줄이는데, 막대한 시간과 비용이 들기 때문에, 본 연구에서 우리의 관심은 이상요인에 의한 이상 상황을 탐지는 하는 것으로 한정한다. 다만, 시뮬레이션을 통해 데이터를 생성할 때, 우연요인을 설명하는 노이즈를 추가하였다.

원자로 노심 운전 이상 발생은 대표적으로 축방향 출력 편차 비정상, 노심 사분출력 비대칭, 원자로 냉각재 펌프(RCP; Reactor Coolant Pump) 기능 상실, 제어봉 위치 편차 발생 등 네 가지 요소에 의해 야기된다. <Figure 1>은 이러한 네 가지 요소로 인하여 생긴 원자로 노심 운전 이상 상황 발생에 따른 특성 요인도를 나타낸다.

Figure 1.

Cause & Effect Diagram for Nuclear Reactor Core Aomalies

노심 운전 이상의 주요 요소 중 하나로 축방향 출력 편차 비정상이 있는데, 이는 상부 출력 노심 상부 출력(PT)과 하부출력(PB)을 활용해 식 (1)과 같이 정의되는 축방향 출력 편차(ASI; Axial Shape Index)를 통해 감시한다.

ASI=PB-PTPB+PT(1) 

ASI는 노내계측기 및 노외계측기 신호를 통해 연속적으로 얻게 되는데, 노심 설계 과정에서 계산된 ASI 값과 비교하여, 전반적으로 노심 운전 중 얻은 실제 ASI가 설계 ASI와 3% 이상 차이가 발생할 경우, 축방향 출력 불균일(AOA; Axial Offset Anomaly)로 규정한다. 축방향 출력 편차 비정상 발생 요소로는 크러드(CRUD; Chalk River Unidentified Deposits)에 의한 출력 이동(CIPS; CRUD Induced Power Shift), 제어봉 위치 비정상, 계측기 오작동, 핵설계보고서(NDR; Nuclear Design Report) 오류 등 있다. 축방향 출력 편차 비정상 신호 발생 시 발생 요인이 CIPS와 제어봉 위치 비정상인 경우는 참 양성, 계측기 오작동, 핵설계보고서 오류일 경우는 허위 양성에 해당한다.

경수로형 노심은 노심 중심을 기준으로 좌우 대칭구조 형태로, 농축도가 다른 핵연료 집합체를 바둑판 형태로 배열한다. 이는 특정 핵연료 집합체에서 핵분열이 집중되어 높은 출력을 내지 않고 중성자 분포가 분산이 되도록 하기 위함이다. 따라서, 노심 사분출력 비대칭(Tilt), 또한, 주요 노심 원전 이상의 요소이다. 노심 사분출력 비대칭은 노심 운전 중 노외 계측기 신호를 통해 사분출력경사비(QPTR; Quadrant Power Tilt Ratio)를 통해 감시한다. QPTR는 원자로 노심을 수평사분면으로 나누어 상·하부 출력 분포를 측정하여 각 영역 출력을 상·하부 평균 출력으로 나눈 값으로, 각 영역 출력이 상·하부 평균 출력으로부터 벗어난 정도를 표시한다. 노심 사분출력 비대칭의 주요 발생 요인으로는 불균형 크러드 발생, 제어봉 오정렬, 불균형 냉각재 입구 온도, 불균형 냉각재 유속, 집합체 오장전, 이전 주기 영향, 계측기 신호 오류 등이 있다. 노심 사분출력 비대칭 신호 발생 시 발생 요인이 불균형 크러드 발생, 제어봉 오정렬, 불균형 냉각재 입구 온도, 불균형 냉각재 유속, 집합체 오장전, 이전 주기 영향인 경우는 참 양성, 계측기 신호 오류인 경우는 허위 양성에 해당한다.

제어봉은 원자로의 노심에 삽입하여 핵연료 반응을 제어하기 위한 목적으로 설치되어 있다. 표준형 원전인 OPR1000형 노심의 경우 73개의 제어봉 집합체가 있으며, 3개의 제어군(정지그룹, 조절제어그룹, 부분강제어그룹), 18개 부그룹으로 구성되어 있다. 원자로 노심 모델을 사분면으로 나누었을 때, 각 사분면에 대칭인 위치에 같은 종류의 제어봉들이 설치되어 있으며, 서로 대칭인 4개의 제어봉을 제어봉 부그룹이라고 부른다. 제어봉 부그룹 내 제어봉의 위치 편차는 정상적인 원자로 운전을 결정짓는 중요한 감시 지표 중 하나이다. 모든 제어봉의 위치는 집합체 연산기(CEAC; Control Element Assembly Calculator)가 감시하며, 제어봉 부그룹 내 25.15 cm 이상의 위치 편차가 발생하면, 계산되는 핵비등이탈율에 따라 운전 정지의 원인이 되기도 한다. 제어봉 위치 편차 발생 신호 발생 요인으로는 실제 제어봉 위치 편차가 발생(참 양성), 제어봉 연산기 및 제어봉 위치 신호 오류(허위 양성)이 있다.

앞에서 언급한 원자로 노심 운전 이상 발생 요인 중, 본 연구는 제어봉 위치 편차 발생을 탐지하기 위한 방법을 제안한다. 제어봉은 그 삽입 과정과 위치에 따라 원전의 운행에 직접적인 영향을 미치는 장치로, 원전의 운행에 핵심적인 역할을 한다. 그 역할이 중요함에도 불구하고, 제어봉과 관련된 사고는 지속적으로 발생하고 있다. 한국원자력안전기술원(Korea Institute of Nuclear Safety, 2020)의 원전 안정 운영 정보 시스템에 따르면 최근 10년간 제어봉과 관련된 원전 사건 사고는 10건 이상 발생하였다. 원전의 출력 감소 및 운행 정지는 원전의 안정성 문제 및 출력 저하로 인한 경제적 손실 등의 문제를 야기한다. 본 연구에서 고려하는 OPR1000형 원전은 1,000MW(= 1GW) 수준의 전력량을 가지며, 운행에 이상이 발생하면 막대한 경제적 손실을 야기할 수 있다. 따라서, 본 연구에서는 시뮬레이션 데이터를 사용하여 제어봉 위치 이상을 효과적으로 진단하고, 실제로 발생할 수 있는 원전 정지를 사전에 탐지할 수 있는 방법론을 개발하고자 한다.

원전의 노심 내부에는 제어봉의 위치를 자동으로 감지는 위치 신호기(RSPT; Reed Switch Position Transmitter)가 설치되어있으나 앞서 설명한 바와 같이 위치 신호기의 신호 오류가 발생할 수 있다. 따라서 본 연구에서 제안하는 방법론을 통해 실제 이상 상황과 신호 오류 상황을 구분해 낼 수 있으며, 이를 통해 불필요한 원전 정지 상황을 사전에 예방할 수 있다.

현재 원자로 노심 이상 탐지는 운전원이 이상 상황 발생 요인을 판별 기준에 따라, ASI, QPTR, CEAC, RCP 값을 감시하면서 운전 이상으로 판별 시 그에 따른 후속 조치를 취하는 것이다. 하지만, 원자로 시스템의 복잡성으로, 노심 상태 변화가 진행되어 이상 상황이 발생했을 경우, 그 원인 규명이 쉽지 않다. 아무리 전문가 지식기반 이상 발생 요인 판별 시스템이 잘 구축되었더라도, 운전원의 판단에 의존하여 관련 지표들을 감시하면서 이상 상황을 판단하는 방식은 탐지 시까지 시간이 지체될 가능성이 높고, 운전자의 경험에 의존하다 보니, 운전자에 따라 그 결과가 일관적이지 않을 수 있다. 이러한 전문가 기반 시스템과 다르게 기계학습 기반 알고리즘은 과거 데이터를 통해 학습을 하고, 학습된 모델을 바탕으로 실시간으로 정상과 이상을 분류해 낼 수 있다. 본 연구에서는 기계학습의 필수적인 요소인 학습 데이터를 시뮬레이션을 통해 생성하고, 그를 이용하여 분류 기반의 이상 탐지에 초점을 두고 있다. 자세한 내용은 다음 장에서 설명하고자 한다.


3. 시뮬레이션 기반 이상 탐지 방법론

이상 상황은 일반적으로 “이상치가 속한 표본에서 다른 샘플의 특성과 현저하게 벗어나 보이는 관측치”를 의미하며, 이러한 상황은 정상 상태의 상황과 다른 메커니즘에 의해 발생했다고 볼 수 있다. 또한, 이러한 이상 관측 상황의 탐지는 데이터의 특성과 탐지 방법에 따라 결정될 수 있다. 이상 탐지 방법론은 신용카드 부정행위 탐지, 임상 실험, 데이터 정체, 네트워크 분석 등 다양한 분야에서 적용되고 있다(Chandola et al., 2009; Hodge and Austin, 2004). 다양한 분야에서 이상 상황 탐지를 위한 방법론들이 연구되고 있으며, 낮은 확률로 발생하는 상황을 이상 상황으로 정의하는 Low-likelihood 방법론이나, 정해진 규칙에서 벗어난 경우를 이상 상황으로 정의하는 Rule-based 방법들이 주로 연구되고 있다. 또한, 기계학습을 활용한 이상 탐지 방법론에서는 군집분석(Clustering)과 같은 비지도 학습을 활용한 방법들도 연구되고 있다. 이러한 이상 탐지 모델을 학습하고 평가하기 위해서는 이상 상황 데이터뿐만이 아니라 정상 상태를 정의하기 위한 다수의 데이터가 필요하다(Chan et al., 2003; Pimentel et al., 2014).

시뮬레이션 기반의 접근법들은 일반적으로 정해진 규칙 내에서 발생할 수 있는 상황들을 가정하거나, 물리적으로 정의된 조건식에 맞추어 무작위 한 상황들을 생성해낸다. 이러한 시뮬레이션 역시 물리 방정식을 위배하거나 상식에 부합하지 않는 결과를 만들어 낼 수 있으며, 이와 같은 상황의 변수들을 이상 상황 탐지에 활용할 수 있다. 또한, 시뮬레이션을 활용한 데이터들은 모델의 학습뿐만 아니라 평가 과정에서도 유용하게 사용할 수 있으며, 이상 상황과 주요 요인을 사전에 파악하여 실제 이상 상황에서 발생하는 비용을 최소화할 수 있다(Andreassen et al., 2020; Fernandez-Godino et al., 2016; Ringberg et al., 2008).

Fernandez-Godino et al.(2016)에서는 산업에 적용될 수 있는 유체와 입자 간의 상호 관계와 이상 상황 감지를 위해, 기계적인 실험과 시뮬레이션 데이터를 활용하였다. 유체에서 발생되는 충격파(Shockwave)와 입자간의 상호관계를 시뮬레이션을 실험하고, 이를 통해 얻어진 데이터를 바탕으로 이상감지 모델을 개발하였다. Andreassen(2020)에서는 입자가속기(LHC : Large Hadron Collider)에서 발생 할 수 있는 이상 상황(예. 새로운 입자의 발견)을 감지하기 위해 시뮬레이션 데이터를 함께 사용하는 SALAD(Simulation Assisted Likelihood-free Anomaly Detection)와 같은 모델을 제안하였다. 이처럼 실제 데이터를 얻기 매우 어렵거나 실험 비용이 큰 경우 시뮬레이션을 활용한 이상감지 방법들이 활용되고 있기 때문에, 본 논문에서도 노심 운영 정보를 시뮬레이션하여 이상 감지 모델을 개발하였다.

본 연구는 원자력 발전소 노심 감시 데이터를 활용해 발전소 운전 중 발생할 수 있는 원자로 노심의 이상 상황을 조기에 탐지하는 기계학습 기반 이상 탐지 방법 개발을 목적으로 한다. 3.1절에서는 인공지능 학습 데이터 생산을 위해 활용한 노심 설계 코드인 RAST-K를 소개하고, 3.2절에서는 RAST-K를 이용한 제어봉 위치 이상 학습 데이터를 생성하는 방법을 기술한다. 3.3절에서는 분류 기반의 이상 탐지 기법에 대해 설명한다.

3.1 RAST-K를 이용한 학습용 노심 운전 데이터 생산

높은 예측 성능을 가진 이상 탐지 모델을 개발하고 이를 학습시키기 위해서는 정상 상태와 이상 상태의 원자로 운전에서 발생하는 충분한 숫자의 학습 데이터가 필요하다. 하지만, 실제 원자로 노심 이상 상황을 재현하여 노심 운전 데이터를 수집하는 것은, 원자력발전소 안전성 문제, 비용 문제, 보안성 문제 등으로 인해 현실적으로 불가능하다. 따라서 본 과제에서는 한수원의 지원을 받아 울산과학기술원에서 개발한 노심 설계 코드인 RAST-K를 활용하여 노심 정상 상황 및 이상 상황에 대한 운전 데이터를 생산하고, 이를 인공지능 학습 및 검증에 활용하였다. RAST-K는 함수화 된 핵단면적, 단순 열수력 모듈, 연소계산 솔버 등 여러 공학적 기능을 포함하고 있어 다양한 노심 모델에 대한 해석이 가능하고, 다양한 운전 상황에 대한 데이터를 생산할 수 있다(Choe et al., 2019).

RAST-K를 이용하여 학습용 노심 운전 데이터를 생산할 때, OPR1000형 노심 모델을 기반으로 하였다. 생성된 노심 운전 데이터와 실제 데이터가 얼마나 정합성을 가지는 지 임계붕소농도(Critical Boron Concentration; CBC), 운전 중 실측 축방향 출력 편차와 설계 축방향 출력 편차(Axial Shape Index; ASI), 구성 요소들의 연소 분포 및 출력 분포 등을 기준으로 RAST-K의 개발 단계에서 평가되었다. OPR1000형 노심 모델의 경우, 실제 측정된 값과 비교하여 CBC 분포는 75ppm 이하, ASI 값은 0.1 이하의 수준의 차이를 보이는 것을 확인하였다. 또한 실제 연소 분포 및 출력 분포의 경우 RMSE 기준으로 1.35% 수준의 높은 정확도를 보였다(Choe et al., 2019). 본 연구는 RAST-K에서 생성되는 시뮬레이션 데이터가 실제 원전에서 생성되는 데이터와 높은 정합성을 가진다고 평가 결과 근거 하에, 실제 노심의 운행 정지를 발생시킨 제어봉 위치 이상 상황에 대한 시뮬레이션 데이터를 활용하였다.

실제로 OPR1000형 노심의 운전 데이터는 총 225개의 노내 계측기를 통해 측정된다. 노내 계측기들은 <Figure 2(a)>에서 노란색으로 표시된 같이 45개 채널에 설치되어 있는데, 채널 당 5개의 노내 계측기가 축방향으로 각 노심 하부로부터 10%, 30%, 50%, 70%, 90% 지점에 위치하여 핵계측기 집합체가 설치된 곳의 핵연료집합체 축방향 출력 분포 뿐 아니라 노심 평균 축방향 출력 분포도 계산할 수 있게 된다(Khoshahval et al., 2018).

Figure 2.

OPR1000 Type Reactor Core Model

노심은 연소가 진행될수록 축 방향 출력 분포가 매우 다른 양상을 보이는 것으로 알려져 있다(Lee et al., 1999). 보통 주기 말이 될수록 노심 중간 부분의 출력이 낮고 노심 상, 하부 출력이 높은 말안장 형태를 지니게 되어 주기 초의 완만한 삼각함수 형태의 출력 분포를 잘 예측하도록 설정된 경계조건을 주기 말까지 사용하면 주기 말 출력 분포 오차는 증가하게 된다. 이 때문에 기존 노심 감시 계통은 연소도 별로 최적의 경계조건을 구하는데, 현재의 노심 감시 계통은 주기 초(BOC, Beginning of Cycle), 주기 중간(MOC, Middle of Cycle), 그리고 주기 말(EOC, End of Cycle)에 적용하는 경계조건을 따로 계산하여 사용하고 있는데, 이는 어느 하나의 경계조건만으로는 주기 전체에 대한 계산 오차를 감당할 수 없기 때문이다. 본 연구에서도 연소도 별로 노심 운전 데이터를 생산한다.

한편, 원자로에는 원자로 노심에 삽입돼 핵연료 반응을 제어하기 위한 목적으로 제어봉이 설치되어 있는데, OPR1000형 노심 모델에서의 제어봉은 크게 세 가지 종류로 구분된다. 운전 중 이상 발생 시 삽입되어 충분한 정지 여유도를 제공하는 정지제어군(SA, SB), 출력 운전 중 노심 내 중성자속 준위를 제어하는 조절제어군(R1, R2, R3, R4, R5), 축 방향 중성자속 분포를 조정하는 부분 강 제어군(PS)이 각 28개, 37개, 8개씩 총 73개의 제어봉 집합체를 가진다.

집합체 응용프로그램에 의해 계산되는 출력 관련 제어봉 삽입 제한치(Power Dependent Insertion Limit, PDIL)는 원자로 출력에 따라 제어봉집합체의 허용 삽입 한계를 결정하는 운전 제한치이다. 출력 관련 제어봉 삽입 제한치는 원자로가 임계상태에 있을 때 정지 여유도와 이탈 제어봉집합체 반응도 제한치가 일치되도록 원자로 운전을 유지하기 위해 사용된다. 출력 관련 제어봉 삽입 제한치는 원자로 출력 신호와 제어봉집합체 위치 신호를 사용하여 결정된다.

제어봉은 원자로 상부에 설치된 제어봉 구동장치(CEDMCS; Control Element Drive Mechanism)에 의해 구동되며, 제어봉의 구동 단위는 1.905cm이다. 원자로 노심 출력(Pcore)에 따른 제어봉 집합체의 삽입을 허용하는 값이 설정되어 있는데, 이를 출력 관련 제어봉 삽입 제한치(PDIL; Power Dependent Insertion Limit)라고 한다. PDIL은 원자로가 임계 상태에 있을 때 정지 여유도와 이탈 제어봉집합체 반응도 제한치가 일치되도록 원자로 운전을 유지하기 위해 사용된다. PDIL은 원자로 출력 신호와 제어봉 집합체 위치 신호를 사용하여 결정된다(Lee et al., 2003).

예를 들어, OPR1000형 노심에서 제어봉 그룹 중 R3(=Bank 3), R4(=Bank 4), R5(=Bank 5)는 PDIL 값이 출력에 따라 변하는 반면, 그 외 R1, R2, SA, SB, PS의 PDIL은 100%로 일정하다. <Figure 3>을 보면 조절제어군 R3, R4, R5는 출력에 따라 그 삽입 한계가 달라지는 것을 알 수 있다. 즉, 정상 운전 중 출력이 감소하면 R3, R4, R5는 일정 수준의 삽입이 허용되지만, 그 외 제어봉 그룹은 삽입이 허용되지 않는다. 원자로 노심 출력 P에 대한 PDIL 값을 각각 PDILR3(P), PDILR4(P), PDILR5(P)과 같이 P의 함수 형태 표기한다.

Figure 3.

PDIL of OPR1000 Type Reactor

본 연구에서는 출력 분포를 100%, 80%, 60%로 구분하여 시뮬레이션을 진행하였고, 출력 분포에 따라 PDIL 값이 변화하는 R3, R4, R5 세 가지 제어봉 집합체의 경우, 이를 위배하지 않는 조건에서 제어봉 위치를 조절하였다. 이와 같은 과정을 통해 초기 제어봉의 위치는 PDIL에 위배되지 않는 위치에서 설정하였으며, 이를 바탕으로 노심의 운전 데이터를 생산하였다.

<Figure 2(b)>가 나타내듯이, 원자로 노심 모델을 사분면으로 나누었을 때, 각 사분면에 대칭인 위치에 같은 종류의 제어봉들이 설치되어 있으며, 서로 대칭인 4개의 제어봉을 제어봉 부그룹이라고 부른다. 제어봉 부그룹 내 제어봉의 위치 편차는 정상적인 원자로 운전을 결정짓는 중요한 감시 지표 중 하나이다. 모든 제어봉의 위치는 집합체 연산기(CEAC; Control Element Assembly Calculator)가 감시하며, 제어봉 부그룹 내 25.15cm 이상의 위치 편차가 발생하면, 계산되는 핵비등이탈율에 따라 운전 정지의 원인이 되기도 한다. 하지만, 이러한 제어봉 위치 신호는 높은 불확실도와 오류 가능성이 있는 것으로 알려져 있다(Oluwasegun and Jung, 2020). 실제로 원자로 운전 중 제어봉 구동장치 이상, CEAC 오작동 등이 빈번히 발생해 다수의 원자력 발전소에서 운전 정지 또는 출력 감발 운전을 경험한 바 있다. 이에 본 연구는 제어봉 위치 신호에만 의존하지 않고, 노심 노내 계측기 신호를 함께 이용하여 제어봉 위치 이상 발생 여부를 조기에 탐지하고자 한다.

3.2 제어봉 위치 이상 데이터 생성 모델

본 연구에서는 한 개의 제어봉집합체 위치가 부그룹 내 제어봉집합체와 5개 스텝(1.905 cm/step) 이상 편차가 발생할 경우, 제어봉 위치 이상이 발생한 것으로 간주하였다. 이는 CEAC에서 제어봉 이상 탐지를 위해 설정된 기준치(25.15cm)보다 작은 값으로, 더 어려운 상황을 가정하였다.

실제로 제어봉 위치 이상이 노심 출력에 끼치는 영향을 파악하기 위하여, <Figure 2(b)>의 E-03에 위치한 제어봉집합체를 5 스텝(9.525cm) 삽입하였다고 설정하고, 제어봉 삽입에 따른 RAST-K 출력 분포의 변화를 비교하였다. <Figure 4(a)>와 <Figure 4(b)>는 각각 정상 상황에서의 집합체 출력 분포와 이상 상황에서의 집합체 출력 분포를 보여준다. <Figure 4(c)>는 정상 상황에서의 집합체 출력값과 이상 상황에서의 집합체 출력값의 차이값의 분포를 보여준다. 제어봉 위치 이상은 노심 전체 출력에 영향을 미치며, 집합체 출력값의 차이는 삽입된 위치로부터 멀어짐에 따라 커지는 것을 알 수 있다.

Figure 4.

Change of Assembly Power Distribution by Insertion of Rod Bank

다양한 제어봉 위치 이상 상황에서의 운전 데이터를 생산하기 위하여, 위치 편차를 발생시키는 제어봉 집합체의 위치와 선택된 제어봉 집합체의 부그룹 내 제어봉 위치 편차 정도를 반복적으로 무작위 샘플링하였다. 세 가지의 노심 모델의 운전 출력값(Pcore=0.60,0.80,1.00)을 고려하였다. 각 Pcore와 연소도 주기(BOC, MOC, EOC) 따른 제어봉 위치 이상 노심 모델 및 학습용 운전 데이터를 아래의 과정을 통해 생산하였다.

  • 1. 73개의 제어용 집합체의 위치 중 하나를 동일한 확률로 무작위로 선택한다.
  • 2. p0Pcore값과 1 사이의 연속 균등 분포에서 무작위 표본 추출하여 생성된다고 가정한다.
p0~uPcore,1
선택된 임의의 출력(p0)에 해당하는 제어용 제어봉 위치를 기본 제어봉 위치로 한다. 즉, R3은 PDILR3(p0) 인출, R4는 PDILR4(p0) 인출, R5는 PDILR5(p0) 인출된 상태가 기본 제어봉 위치가 된다.
  • 3. 선택한 제어봉 집합체에 발생시킬 위치 편차(제어봉 스텝 수) 아래의 정규분포를 따른다고 가정한다. 이때 m값이 양수이면 제어봉 인출, 음수이면 제어봉 삽입 상황을 나타낸다.
m~N0,7.452
  • 4. 3.에서 결정한 제어봉 편차가 5스텝 이상일 경우 해당 모델을 제어봉 위치 이상 발생모델(y=1)로 간주한다.
y=0ifm<51otherwise
  • 5. 1~4를 통해 결정된 제어봉 위치의 원자로 노심 모델에 대해 원자로 운전 데이터(X)를 생산한다. 원자로 운전 데이터는 RAST-K로 계산한 모의 노내 계측기 신호이다. 이 때 우연요인에 의한 품질변동을 설명하기 위하여 다음과 같이 X 요소값(x)들에 각각 가우시안 노이즈(Gaussian noise)를 아래와 같이 추가하였다.
x*=x×1+z, z~N0,0.012(2) 
가우시안 노이즈가 추가된 x*로 구성된 X와 같은 크기의 행렬을 X*로 표기한다.
  • 6. 1~5를 총 N번 반복하여 제어봉 위치 이상 발생 노심 모델과 두 가지 종류의 노심운전 데이터셋인 (yi,Xii=1, Nyi,Xi*i=1, N)을 생산한다.

위에서 설명하였듯이, 제어봉 편차가 5스텝 이상일 경우 해당 모델을 제어봉 위치 이상 발생모델(y=1)로 간주하는데, 본 연구에서는 정상 상태와 이상 상태의 데이터가 같은 비율로 생성되도록 m이 따르는 정규 분포의 표준 편차 값을 설정하였다. 즉, mN(0, 7.452)에서 7.452m의 확률 밀도 함수 f-55fm0.5을 만족하도록 설정하였다. 위 과정을 통해 제어봉 위치 이상 노심 모델에 대한 모의 계측기 신호 데이터를 세 가지의 노심 모델의 운전 출력(100%, 80%, 60%)과 세 개의 연소도 주기(BOC, MOC, EOC)에서 충분한 수의 데이터를 생산하였다. 각 운영 설정마다 정상상태와 이상상태의 데이터를 5,000개씩, 총 10,000개의 데이터를 생성하였다.

4번 단계에서는 우연요인에 의해 발생하는 품질변동을 요소값(x)에 반영하였다. 식 (2)x*N(x, (0.01×x)2)과 동일하며, x*x를 기대값으로, x의 1% 값을 그 표준편차로 가지는 정규 분포를 따르는 확률 변수로부터 추출한 값이라고 해석할 수 있다.

제어봉 위치 이상 노심 모델을 이용해 생산한 데이터는 OPR1000형 노심의 한 연소도 주기에서의 스냅(snap) 데이터이며, X는 10,000번 반복 생성된 225개 노내 계측기 신호 데이터와 73개의 제어봉 위치 정보로써 그 사이즈는 10,000×298이며, y은 노심 모델의 제어봉 위치 이상 발생 여부를 1과 0으로 표현한 사이즈가 10,000인 벡터(vector)이다. <Table 1>은 실제 생성된 데이터의 예시이다.}

Example of Simulation Data

<Table 1>에서 CR1, …, CR73 값은 CEAC에 의해 계산된 <Figure 2(b)>에 표시된 73개 제어봉의 위치 신호값이다. H1P1, …, H5P45은 총 225개의 노내계측기 신호값이다. H1, …, H5는 축방향 5개의 위치를 의미하고, P1, …, P45은 <Figure 2(a)>에 표시된 45개의 노내 계측기를 각각 의미한다. 이렇게 제어봉 위치 신호값과 노내계측기 신호값, 총 298개의 값을 시뮬레이션을 통해 생성하였고, 이를 바탕으로 노심의 운전 상태를 예측하는 모델을 개발하였다.

3.3 시뮬레이션 데이터 생성을 통한 분류 기반 이상 탐지 기법

일반적으로, 통계적 이상 탐지는 그 목적에 따라 제1 국면(Phase I)과 제2 국면(Phase II)으로 구분한다(Park and Kim, 2020). 보통 제1 국면에서는 공정이 관리 상태(In-control)인지 확인하는 용도로 사용되며, 공정이 이상 상태(Out-of-control)로 판단될 경우, 공정 모수의 변화를 유발하는 이상 요인을 파악하여 제거함으로써 공정을 관리 상태로 만들고, 관리 상태에서 생성된 데이터를 통하여 정상 상태와 이상 상태의 경계를 결정한다. 우리의 경우는 데이터 생산체계를 통하여 통제된 가운데 시뮬레이션 데이터를 생성하고 있기 때문에, 관리 상태를 별도로 확인할 필요는 없고, 제1 국면에서는 학습 데이터를 이용하여 모델을 학습시킴으로써 정상 상태와 이상 상태의 경계를 결정짓게 된다. 이 과정에서 일부 발생할 수 있는 극단치(outlier)나 데이터 오류는 제거하는 전처리 과정을 거칠 수 있다. 제2국면에서는 학습된 분류 모델을 이용하여 실제 데이터를 모니터링하면서 실시간으로 정상 상태인지 이상 상태인지 분류를 하게 된다. 시뮬레이션 데이터 생성을 통한 분류 기반 이상 탐지 방법론에 대한 개요는 <Figure 5>에 요약하였다.

Figure 5.

Overview of Anomaly Detection Approach Using Simulation Data

기계학습 기반 이상 탐지 기법은 크게 분류(classification) 기반 이상 탐지 기법, NN(Nearest neighbor) 기반 이상 탐지 기법, 군집화(clustering) 기반 이상 탐지 기법, 이상 탐지의 통계적 기법, 정보 이론 이상 탐지 기법, 스펙트럴 이상 탐지 기법, 맥락적 이상 탐지 등으로 나눌 수 있다(Chandola et al., 2009; Hodge and Austin, 2004). 이러한 기법들은 데이터에 대한 레이블(Label)이 주어졌는지 여부에 따라 지도 학습과 비지도 학습으로 분류가 가능하다. 본 연구에서는 핵 코어 분석 코드인 RAST-K를 사용하여 데이터에 대한 레이블 데이터도 함께 생성 가능하기 때문에, 대표적인 지도 학습 기반의 이상 탐지 기법인 분류 기반 이상 탐지 기법을 고려하였다.

분류 기반 이상 탐지 기법은 각 개체가 어느 클래스에 속하는지에 대한 레이블이 있는 데이터로 분류기(classifier)를 학습(training)한 뒤, 학습된 모형으로 새로운 개체에 대해 각 클래스에 속할 확률을 예측하는 방법이다. 이 기법을 적용할 때는 ‘분류기를 주어진 특성 공간(feature space)에서 학습시킬 수 있다’고 가정한다. 데이터 클래스 개수에 따라 다중 분류(multiclass classification), 이진 분류(binary classification), 일집단 분류(one-class classification)로 나눌 수 있다(Tan et al., 2016). 이상 탐지를 위해서 다중 분류와 이진 분류의 경우는 분류기가 각 정상 클래스와 이상 클래스를 구분하도록 학습시키고, 이상 클래스에 포함 되는 개체를 이상값으로 처리한다. 반면, 일집단 분류는 학습 자료가 모두 정상이라고 가정하고 정상에서 벗어난 개체를 이상값으로 처리한다.

제어봉 위치 이상 노심 모델의 경우 제어봉 편차가 5스텝 미만인 경우가 정상이고 5스텝 이상인 경우는 이상으로 분류되는 이진 분류 문제라고 볼 수 있다. 따라서, 우리는 이진분류 문제에 사용되는 대표적인 지도 학습 기반의 이상 탐지 기법들을 고려하였다. 본 연구에서는 로지스틱 회귀(LR; Logistic Regression), 서포트 벡터 머신(SVM; Support Vector Machine), 나이브 베이즈(NB; Naive Bayse), KNN 분류기(KNN; K-Nearest Neighbor classifier), MLP(Multi-Layer Perceptron), 의사결정나무(DT; Decision Tree), 랜덤포레스트(Random Forest), XGboost(XGBoost; Extreme Gradient Boosting), LightGBM(LGBM; Light Gradient Boosting Machine)이 사용되었다.

또한, 실험 결과에서 우수한 성능을 보인 Random Forest, XGboost, LGBM 모델을 앙상블한 모델을 추가적으로 사용하여 결과를 비교하였다. 세 가지 모델은 모두 의사결정나무(Decision Tree) 방법론에 기반하지만, 각각 다른 방식으로 앙상블을 수행한다. Random Forest 모델의 경우, Bagging에 기반하는 앙상블 방법을 통해 예측 결정을 하게 된다(Breiman, 2001). XGboost와 LGBM 모델은 Boosting을 사용한다는 공통점이 있지만, XGBoost가 균형트리분할(level-wise) 방법론을 사용하는 반면, LightGBM은 리프 중심 트리 분할(leaf-wise) 방법론을 사용한다는 차이점이 있다(Chen and Guestrin, 2016; Ke et al., 2017). 이렇게 다른 방식의 앙상블을 통해 학습된 모델들을 soft voting ensemble 방식을 통해 결합하였으며, 이러한 방식은 bottom-up ensemble 방식으로 알려져 있다(Rokach, 2009). 본 연구에서는 학습된 개별 모델에서 예측하는 클래스의 확률을 계산하고 클래스 별 평균치를 구하여 최종 클래스를 예측하였다. 실제 데이터에서는 이상 데이터가 매우 적은 비율로 존재하고, 우연요인에 의한 노이즈를 고려해야 한다. 따라서, 본 연구에서는 앙상블 모델과 같이 단일 모델에 비교해 견고한(Robust) 모델이 고려되었다.


4. 실험 및 결과

4.1 이상감지 모델 선택

RAST-K를 이용하여 제어봉 위치 정상/이상에 따른 노심 운전 데이터를 생산하였다. 다양한 노심 운전 상황에서의 분류 기반 이상 탐지 기법들의 성능평가를 위해 주기 초, 주기 중, 주기 말의 세 연소도 스텝과 전출력(100%), 80%출력, 60%출력의 세 출력 운전 상황을 고려하였다. 핵연료 평균 연소도는 주기 초(BOC; Beginning Of Cycle)는 0.0 GWd/MTU, 주기 중(MOC; Middle Of Cycle)은 6.0 GWD/MTU, 주기 말(EOC; End Of Cycle)은 17.0 GWd/MTU로 선정하였다.

앞서 설명한 방법으로 생성된 yi,Xii=1, ,Nyi,Xi*i=1, ,N을 선정한 분류 기반 이상 탐지 기법들에 적용하여 그 성능을 검증하였다. 각 연소도 주기, 출력에 따라 생성된 10,000개의 데이터를 활용하였으며, 시뮬레이션 데이터는 학습 데이터 : 검증 데이터 : 실험 데이터 = 6 : 2 : 2의 비율로 무작위로 나누어 모델의 학습과 검증, 테스트에 사용하였다. 노심의 운전 환경이 주기와 출력에 따라 다양하게 나타나고, 그에 따른 각 센서 값들의 특성을 효율적으로 학습하기 위해 특성들의 값을 표준화(Standardization)하는 전처리를 수행하였다. 또한, 5-겹 교차 검증(5 Fold Cross Validation)을 통해 가장 우수한 모델을 선택하였다.

모델의 성능평가지표로 균형정확도, F1 score, 정밀도, 재현률 등을 고려하였다. 이진 분류(Binary classification) 문제에서 정확도는 아래와 같이 정의한다.

Accuracy=TP+TNTP+TN+FP+FN×100%

여기서 TP는 참 양성(true positive), TN는 참 음성(true negative), FP는 허위 양성(false positive), FN는 허위음성(false negative)이다. 이를 바탕으로 모델의 성능을 계산하는 지표들은 다음과 같다.

Sensitivity=TPTP+FNSpecificity =TPFP+TNRecall =TPTP+FNPrecision =TPTP+FP

실제 이상 데이터의 경우 불균형한 분포를 나타내기 때문에, 불균형 데이터에서 성능을 검증하기 위해 균형정확도(Balanced Accuracy)와 F1 score를 모델의 평가지표로 사용하였다.

Balanced Accuracy는 각 클래스별 정확도의 평균을 나타나며, 민감도(Sensitivity)와 특이도(Specificity)의 기하평균으로 다음과 같이 계산 할 수 있다.

Balanced Accuracy Score= Sensitivity+Specificity  2

F1 score는 정밀도(Precision)와 재현률(Recall)의 조화 평균으로 아래와 같이 나타낼 수 있다.

F1 Score=2×Precision×RecallPrecision+Recall

모델 선택 단계에서는 시뮬레이션 데이터를 동일한 개수로 샘플링하여 모델의 학습과 성능비교를 수행하였다. <Table 2>와 <Table 3>은 노이즈를 포함하지 않은 시뮬레이션 데이터(yi,Xii=1, ,N)에 대한 분류 기반 이상탐지 모델 별 성능 비교 결과이고, <Table 4>와 <Table 5>는 노이즈가 포함된 시뮬레이션 데이터(yi,Xi*i=1, ,N)에 대한 성능 비교 결과이다.

Model Performance Comparison : Balanced Accuracy Score(%) (noise free)

Model Performance Comparison : F1 Score (noise free)

Model Performance Comparison : Balanced Accuracy Score(%) (noise added)

Model Performance Comparison : F1 Score (noise added)

결과를 비교해보면, 예상대로 노이즈가 없을 때, 이상 탐지 성능이 더 우수하다. 이는 노이즈의 정도가 커지면, 더 심해질 것으로 예상된다. 다양한 설정값에 대해서도 일정한 패턴이 나타났는데, 예외적인 경우도 있지만, 전반적으로 노심 모델의 운전 출력값이 높을 수록 더 분류기의 성능이 더 정확해졌다. 또한, 예상한 바와 같이 앙상블 모델이 다수의 노심 운행 환경에서 이상 상황을 잘 감지하는 것을 확인 할 수 있었다. 이상 탐지 기법 간에도 성능에서 차이를 보였는데, Random Forest, XGBoost, LGBM과 같은 의사결정나무 기반의 비선형 모형들이 상대적으로 더 좋은 성능을 보였다. 이는 225개의 달하는 계측기 값들과 73개의 제어봉 위치 데이터가 형성하는 결정 경계가 복잡하고 비선형성을 갖기 때문이라고 판단된다. 마찬가지로 MLP 모델도 우수한 성능을 보였으며, 딥러닝 기반의 모델이 잘 작동할 가능성이 있음을 확인하였다. 일반적으로 딥러닝 모델들이 비선형 관계를 가지는 데이터들에서 잘 작동하기 때문에, 향후 연구에서는 딥러닝 기반의 개선된 모델을 제안하고자 한다.

전체 10개 모델 중 상대적으로 우수한 성능을 보인 의사결정나무 기반의 모델 5개를 비교하였는데, 노심 운전 세팅 중 전반적으로 정확도가 좋지 않았던 주기 초(BOC)의 저출력(60%) 상황에서 각 모델의 성능을 비교하였다. <Figure 6>에서는 학습된 모델의 성능을 비교하기 위해 Precision-Recall Curve를 그리고, Average Precision score를 계산하여 결과를 비교하였다. 또한, <Figure 7>에서는 ROC Curve를 기반으로 AUC 값으로 모델의 성능을 비교하였으며, 제안한 Ensemble 모델이 가장 우수하게 작동하는 것을 확인할 수 있었다. 전체적으로 Precision이 Recall보다 높은 경향을 보이는데, 이는 모델이 검출해 낸 이상 상태들을 정확히 분류하여 오검출(False Alarms)이 낮다고 판단할 수 있다.

Figure 6.

ROC Curve Comparison : Classification Models

Figure 7.

Precision-Recall Curve Comparison : Classification Models

가장 우수한 성능을 보인 Ensemble 모델을 사용하여 두 가지 경우에 대해 추가적인 분석을 진행하였다. 첫번째는 연소도 주기에 따른 모델 성능의 차이이다. <Figure 8>에서 보여주듯이, 연소도 주기에 따라서는 모델의 성능이 크게 차이를 보이지 않는 것을 확인하였다. 두번째는 운전 출력값에 따라 변화하는 모델의 성능 차이이다. <Figure 9>에서 보여주듯이, 운전 출력값이 높을수록 AUC가 증가하는 경향이 나타나고 있으며, 이는 노이즈가 없는 경우와 노이즈가 추가된 경우에서 동일하게 확인할 수 있다. 따라서, 본 연구에서 제안한 기계학습 모델들은 노심 운전의 낮은 출력 구간에서 상대적으로 잘 작동하지 않는 것을 확인할 수 있다. 향후 연구에서는 이러한 단점을 개선한 모델을 개발하고자 한다.

Figure 8.

ROC Curve Comparison : Burn Up

Figure 9.

Roc Curve Comparison : Power Rate

4.2 이상 상황 비율에 따른 결과 비교

이상 상황 비율에 따른 모델의 성능을 비교하기 위해, 앞서 실험의 경우와 동일한 모델과 데이터를 사용하였다. 모델은 균형데이터에서 학습 및 평가 시에 가장 좋은 성능을 보인 Ensemble 모델을 사용하였다. 즉, 모델은 시뮬레이션 학습 데이터 6,000개에서 정상/이상을 같은 비율로 학습하였다. 검증 데이터와 학습 데이터의 경우는, 실제로 이상 상황이 발생하는 경우는 매우 드물기 때문에, 이상 상황 발생 비율이 적은 불균형 상황을 가정하고 실험을 진행하였다. 실험 진행 시 검증데이터와 실험데이터는 정상 데이터를 고정한 후 이상 데이터를 적은 수로 샘플링하는 방식을 취했다. 예를 들어, 10:1의 불균형 비율에서는 정상 데이터 1,000개와 이상 데이터 100개로 각각 검증데이터와 실험데이터를 설정하였다. 데이터 불균형 비율을 50:50, 50:10, 50:5로 변화시켜가며 모델의 성능을 평가하였다. 모델의 성능 지표는 앞서 설명한 Precision Score와 Recall Score를 사용하였다. 정상상태(클래스 0)와 이상상태(클래스 1)의 비율과 이를 각각 분류하는 성능의 변화를 중점적으로 분석하였다.

<Table 6>과 <Table 7>은 노이즈를 포함하지 않은 시뮬레이션 데이터에 대한 분류 기반 이상탐지 모델 별 성능 비교 결과이고, <Table 8>과 <Table 9>는 노이즈가 포함된 시뮬레이션 데이터에 대한 성능 비교 결과이다. 대체로 불균형 비율이 커질수록 모델의 성능이 편향되어 나타나는 것을 볼 수 있으며, 이는 학습 데이터의 정상/이상 데이터 분포와 실험 데이터의 정상/이상 데이터 분포가 다르기 때문에 나타나는 현상이라고 볼 수 있다. 불균형 데이터가 증가하면 Precision은 감소하는 반면 Recall 값은 증가하는 경향을 보여주고 있다. 이상 상황의 검출에 해당하는 재현율이 높은 반면 오검출이 증가하는 상황이라고 볼 수 있다.

Model Performance Comparison with Imbalanced Data : Precision Score (Noise free)

Model Performance Comparison with Imbalanced Data : Recall Score (Noise free)

Model Performance Comparison with Imbalanced Data : Precision Score (Noise added)

Model Performance Comparison with Imbalanced Data : Recall Score (Noise added)

노이즈가 추가된 경우에도 앞선 상황과 비슷한 양상을 보이고 있으며, 불균형 비율이 증가할 때 전반적인 모델의 성능이 감소하는 것을 볼 수 있다. 출력이 높은 경우 불균형 비율이 커질수록 Recall 값이 크게 증가하는 것을 볼 수 있다. 이는 앞서 설명한 바와 같이 실제 이상 상황을 이상 상황이라고 잘 판단할 수 있는 반면 오검출이 높다는 단점이 있다. 하지만 실제 원전의 경우 이상 상황이 발생할 경우 작동 중지 등 심각한 문제를 야기할 수 있으며, 이를 예방하기 위해서는 재현율이 높은 모델이 적합하다고 여겨진다.


5. 결 론

본 연구에서는 기계학습 기반 원자로 노심 이상 상황을 조기에 진단하는 방법론을 제안하였다. 원자로 노심 운전의 이상 상태를 야기시키는 이상요인에 대하여 분석하였으며, 이러한 이상요인에 대한 이해를 바탕으로, 시뮬레이터를 활용한 데이터 생성 방법을 구축하였다. 본 연구에서는 원자로 노심 이상 상황을 야기하는 네 가지 주요 이상요인 중, 제어봉 위치 편차 발생 요인을 이상요인에 집중하였다. 제어봉 위치 이상 상황에 대한 도메인 지식(Domain knowledge)을 바탕으로 다양한 실제 상황을 RAST-K가 정확하게 모사할 수 있도록 통제 변수(Control variables)을 설정하여, 우연요인이 설정된 데이터셋과 우연요인은 설정되지 않은 데이터셋, 두 종류의 시뮬레이션 데이터셋을 생성하였다. 두 종류의 데이터셋에 여섯 가지 분류 기반의 이상탐지 모델들의 성능을 비교하였다. 그 결과, 주기 말로 갈수록 정확도 성능은 향상되는 것으로 나타났으며, 일부 이상탐지 모델의 경우는 그렇지 않았다. 예상대로 노이즈가 없을 때, 노심 모델의 운전 출력값이 높을 수록 더 정확한 성능을 보였다. 모델 별로는 Random Forest, XGBoost, LGBM과 같은 비선형 모형들이 좋은 성능을 보였다. 이는 225개의 달하는 계측기 값들과 73개의 제어봉 위치 데이터가 형성하는 결정 경계가 복잡하고 비선형성을 갖기 때문이라고 판단된다. 추가적인 성능 비교 결과에서 높은 운전 출력 상황에서는 이상 상황을 상대적으로 쉽게 탐지할 수 있는 반면, 낮은 운전 출력 상황에서는 이상 감지가 더 어렵다는 것을 알 수 있다. 또한, 노이즈가 추가된 상황에서 이상감지가 어렵기 때문에, 추후 연구에서는 정확도가 낮은 구간들을 개선할 수 있는 방법들을 개발하고자 한다.

본 연구에서 우리는 제어봉 위치 이상 상황에 대한 이상 탐지 기법들을 개발하였지만, 우리가 개발한 방법론은 선정된 특정 이상요인에 제한된 것은 아니고, 다른 요인들에게도 확장 적용 가능하다. 향후 다른 이상요인들을 포함한 종합적인 이상 탐지 기법을 개발할 예정이며, 원자력 노심 운전 데이터에 특화된 새로운 딥러닝 기반의 모형을 제안하고자 한다.

Acknowledgments

이 논문은 KOREA HYDRO & NUCLEAR POWER CO., LTD(No. 2018-Tech-07)의 지원을 받아 수행되었음.

References

  • Andreassen, A., Nachman, B., and Shih, D. (2020), Simulation Assisted Likelihood-Free Anomaly Detection, Physical Review D, 101(9), 095004, [https://doi.org/10.1103/PhysRevD.101.095004]
  • Breiman, L. (2001), Random Forests, Machine Learning, 45(1), 5-32, [https://doi.org/10.1023/A:1010933404324]
  • Chandola, V., Banerjee, A., and Kumar, V. (2009), Anomaly Detection : A Survey, ACM Computing Surveys(CSUR), 41(3), 1-58, [https://doi.org/10.1145/1541880.1541882]
  • Chen, T. and Guestrin, C. (2016), Xgboost : A Scalable Tree Boosting System, Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794, [https://doi.org/10.1145/2939672.2939785]
  • Choe, J. W., Choi, S. Y., Zhang, P., Park, J. S., Kim, W. K., Shin, H. C., Lee, H. S., Jung, J.-E., and Lee, D. J. (2019), Verification and Validation of STREAM/RAST-K for PWR Analysis, Nuclear Engineering and Technology, 51(2), 356-368. [https://doi.org/10.1016/j.net.2018.10.004]
  • Fernandez-Godino, M G., Diggs, A., Park, C. Y., Kim, N. H., and Haftka, R. T. (2016), Anomaly Detection Using Groups of Simulations, 18th AIAA Non-Deterministic Approaches Conference, 1195. [https://doi.org/10.2514/6.2016-1195]
  • Hodge, V. and Austin, J. (2004), A Survey of Outlier Detection Methodologies, Artificial Intelligence Review, 22(2), 85-126. [https://doi.org/10.1023/B:AIRE.0000045502.10941.a9]
  • Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., Ye, Q., and Liu, T.-Y. (2017), Lightgbm : A Highly Efficient Gradient Boosting Decision Tree, Advances in Neural Information Processing Systems, 3146-3154,
  • Khoshahval, F., Park, M. Y., Shin, H. C., Zhang, P., and Lee, D. J. (2018), Vanadium, Rhodium, Silver and Cobalt Self-Powered Neutron Detector Calculations by RAST-K v2.0, Annals of Nuclear Energy, 111, 644-659, [https://doi.org/10.1016/j.anucene.2017.09.048]
  • Kim, D.-U.(2018), The Status of Development of Nuclear Power Plant Monitoring and Diagnosis Technology Applying the Fourth Industrial Revolution Technology, Nuclear Industry, 38(3), 49-54. [https://doi.org/10.1016/j.net.2016.10.004]
  • Korea Institute of Nuclear Safety (2020), OPIS-Operational Performance Information System for Nuclear Power Plant, https://opis.kins.re.kr, .
  • Lee, C. K., Kim, D. H., Oh, I. S., Han, J. B., Shin, J. W., and Kim, Y. B. (2003), Functional Descriptions for Instrumentation and Control System in Nuclear Power Plants, KAERI.
  • Lee, E. G., Kim, Y. H., Cha, K. H., and Park, M. K. (1999), Calculation of Core Axial Power Shapes Using the Pseudo-Detector Information, Proceedings of the Korean Nuclear Society Spring Meeting.
  • Montgomery, D. C. (2007), Introduction to Statistical Quality Control, John Wiley & Sons.
  • Oluwasegun, A. and Jung, J.-C. (2020), The Application of Machine Learning for the Prognostics and Health Management of Control Element Drive System, Nuclear Engineering and Technology, 52(10), 2262-2273, [https://doi.org/10.1016/j.net.2020.03.028]
  • Park, J. M. and Kim, S. I. (2020), Maritime Anomaly Detection Based on VAE-CUSUM Monitoring System, Journal of the Korean Institute of Industrial Engineers, 46(4), 432-442, [https://doi.org/10.7232/JKIIE.2020.46.4.432]
  • Pimentel, M. A., Clifton, D. A., Clifton, L., and Tarassenko, L. (2014), A Review of Novelty Detection, Signal Processing, 99, 215-249, [https://doi.org/10.1016/j.sigpro.2013.12.026]
  • Ringberg, H., Roughan, M., and Rexford, J. (2008), The Need for Simulation in Evaluating Anomaly Detectors, ACM SIGCOMM Computer Communication Review, 38(1), 55-59, [https://doi.org/10.1145/1341431.1341443]
  • Rokach, L. (2009), Taxonomy for Characterizing Ensemble Methods in Classification Tasks : A Review and Annotated Bibliography, Computational Statistics and Data Analysis, 53(12), 4046-4072. [https://doi.org/10.1016/j.csda.2009.07.017]
  • Tan, P.-N., Steinbach, M., and Kumar, V. (2016), Introduction to Data Mining, Pearson Education India.
저자소개

오용경 : 울산과학기술원 물리학과에서 2015년 학사학위를 취득하고 울산과학기술원 기술경영전문대학원에서 2017년 기술경영학 석사를 취득했으며 현재는 울산과학기술원 산업공학과 박사과정에 재학중이다. 연구분야는 기계학습 및 딥러닝 기술을 활용한 분석 기술과 이를 이용한 산업인공지능, 이상감지, 예측 시스템 개발이다.

김한주 : 울산과학기술원 원자력공학과에서 2016년 학사학위를 취득하고 울산과학기술원 원자력공학과 석박사통합과정 재학 중이다. 연구분야는 원자로노심 다물리해석체계 개발, 원자력발전소 디지털 트윈 시스템 개발 및 노심이상진단 기술개발이다.

이덕중 : 서울대학교 원자핵공학과에서 1993년 학사, 1995년 석사학위를 취득하고, 2003년 미국 Purdue 대학교에서 원자력공학 박사학위를 취득하였다. Studsvik Scandpower(2005~2009), 오크리지 국립연구소(2009~2011)에 근무하였으며, 2011년부터 울산과학기술원 원자력공학과 교수로 재직하고 있다. 2016년 원전 해석 소프트웨어 개발 및 기술 자문 기업인 (주)에이엔티에스를 설립하였다. 연구분야는 원자로 노심분야 방법론개발, 시뮬레이션 코드개발(STREAM, RAST-K, MCS) 및 원자로 노심 설계, 원자력발전소 디지털 트윈 시스템 개발 및 노심이상진단 기술개발이다.

김성일 : 연세대학교 정보산업공학과에서 2005년 학사, Georgia Tech에서 2007년 산업공학 석사, 2011년에 산업공학 박사 학위를 취득하였다. 미국 Terra Technology와 삼성 SDS에서 연구원을 역임하고, 2016년부터 울산과학기술원 산업공학과 교수로 재직 중이다. 연구 분야는 산업통계, 품질 공학, 산업 인공지능이다.

Figure 1.

Figure 1.
Cause & Effect Diagram for Nuclear Reactor Core Aomalies

Figure 2.

Figure 2.
OPR1000 Type Reactor Core Model

Figure 3.

Figure 3.
PDIL of OPR1000 Type Reactor

Figure 4.

Figure 4.
Change of Assembly Power Distribution by Insertion of Rod Bank

Figure 5.

Figure 5.
Overview of Anomaly Detection Approach Using Simulation Data

Figure 6.

Figure 6.
ROC Curve Comparison : Classification Models

Figure 7.

Figure 7.
Precision-Recall Curve Comparison : Classification Models

Figure 8.

Figure 8.
ROC Curve Comparison : Burn Up

Figure 9.

Figure 9.
Roc Curve Comparison : Power Rate

Table 1.

Example of Simulation Data

Label H1P1 H1P2 H5P45 CR1 CR2 CR73
1 1.03077 1.18632 1.01572 413.334 413.334 413.334
1 1.08042 1.24284 1.04327 413.334 413.334 413.334
0 1.07975 1.24202 1.04375 413.334 413.334 413.334
0 1.06868 1.22978 1.04068 413.334 413.334 413.334

Table 2.

Model Performance Comparison : Balanced Accuracy Score(%) (noise free)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
LR 79.30 80.70 87.60 76.85 82.25 86.15 78.50 82.95 86.25
SVM 60.35 68.85 86.60 71.35 77.55 86.50 74.15 82.00 87.10
NB 56.20 53.25 78.75 53.70 52.90 77.80 52.00 55.65 78.25
KNN 74.20 77.65 98.55 74.24 78.70 98.85 75.70 78.70 99.20
MLP 81.00 80.30 98.25 81.10 83.65 99.65 81.90 82.20 99.65
DT 79.90 81.70 99.95 78.85 81.90 100.00 80.25 82.30 99.90
RF 82.15 83.15 99.75 82.40 82.65 100.00 83.55 82.80 99.95
XGBoost 82.35 85.90 100.00 81.55 84.10 100.00 83.35 84.65 100.00
LGBM 82.15 85.80 100.00 82.00 86.50 100.00 82.80 85.75 100.00
Ensemble 83.45 86.00 100.00 83.50 86.65 100.00 84.15 86.50 100.00

Table 3.

Model Performance Comparison : F1 Score (noise free)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
LR 0.760 0.785 0.869 0.730 0.802 0.854 0.757 0.814 0.857
SVM 0.624 0.717 0.848 0.694 0.735 0.850 0.701 0.788 0.865
NB 0.518 0.551 0.750 0.525 0.565 0.743 0.417 0.555 0.750
KNN 0.671 0.736 0.986 0.683 0.749 0.989 0.703 0.750 0.992
MLP 0.788 0.801 0.983 0.798 0.824 0.997 0.811 0.803 0.997
DT 0.794 0.818 1.000 0.787 0.816 1.000 0.803 0.821 0.999
RF 0.819 0.833 0.998 0.825 0.827 1.000 0.836 0.829 1.000
XGBoost 0.814 0.855 1.000 0.809 0.837 1.000 0.825 0.840 1.000
LGBM 0.808 0.852 1.000 0.810 0.858 1.000 0.818 0.849 1.000
Ensemble 0.825 0.857 1.000 0.830 0.864 1.000 0.836 0.860 1.000

Table 4.

Model Performance Comparison : Balanced Accuracy Score(%) (noise added)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
LR 58.75 61.60 74.00 59.75 61.50 73.40 60.10 63.35 74.20
SVM 54.75 53.85 66.80 58.90 56.60 66.25 53.25 59.20 69.75
NB 55.25 53.50 70.80 54.45 52.65 71.15 52.05 55.35 74.30
KNN 57.60 59.20 62.75 54.10 58.95 63.75 61.35 61.70 63.35
MLP 69.05 69.80 73.30 70.95 71.00 73.65 72.55 71.60 74.15
DT 61.55 65.70 69.90 62.60 67.05 70.55 66.65 67.80 71.90
RF 71.65 75.25 79.85 71.40 74.60 78.50 73.05 76.30 81.20
XGBoost 67.35 70.95 77.50 69.25 70.75 77.60 70.95 71.50 79.45
LGBM 69.95 74.80 79.25 70.50 73.80 79.30 74.05 75.30 80.35
Ensemble 71.95 75.40 80.80 72.70 74.25 79.60 74.60 77.50 82.00

Table 5.

Model Performance Comparison : F1 Score (noise added)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
LR 0.575 0.611 0.724 0.587 0.604 0.720 0.591 0.623 0.727
SVM 0.549 0.554 0.534 0.394 0.637 0.686 0.638 0.663 0.639
NB 0.509 0.547 0.588 0.539 0.554 0.595 0.416 0.563 0.654
KNN 0.493 0.496 0.532 0.470 0.491 0.537 0.496 0.526 0.556
MLP 0.686 0.690 0.725 0.714 0.709 0.724 0.721 0.703 0.734
DT 0.613 0.660 0.699 0.623 0.669 0.705 0.657 0.678 0.722
RF 0.672 0.721 0.775 0.668 0.718 0.761 0.696 0.726 0.798
XGBoost 0.652 0.689 0.754 0.666 0.696 0.757 0.691 0.688 0.784
LGBM 0.660 0.719 0.769 0.666 0.713 0.770 0.710 0.718 0.788
Ensemble 0.687 0.722 0.787 0.695 0.716 0.775 0.715 0.745 0.805

Table 6.

Model Performance Comparison with Imbalanced Data : Precision Score (Noise free)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
50:50 0.877 0.878 1.000 0.857 0.880 1.000 0.865 0.894 1.000
50:10 0.352 0.356 0.161 0.338 0.330 0.253 0.312 0.330 0.403
50:5 0.182 0.199 0.112 0.177 0.181 0.112 0.173 0.191 0.220

Table 7.

Model Performance Comparison with Imbalanced Data : Recall Score (Noise free)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
50:50 0.778 0.836 1.000 0.804 0.849 1.000 0.809 0.828 1.000
50:10 0.814 0.858 0.755 0.813 0.872 0.831 0.867 0.839 0.765
50:5 0.831 0.874 0.882 0.822 0.873 0.900 0.872 0.848 0.798

Table 8.

Model Performance Comparison with Imbalanced Data : Precision Score (Noise added)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
50:50 0.777 0.829 0.885 0.787 0.798 0.864 0.814 0.859 0.879
50:10 0.350 0.345 0.254 0.336 0.345 0.259 0.371 0.362 0.270
50:5 0.198 0.192 0.122 0.189 0.193 0.123 0.209 0.201 0.127

Table 9.

Model Performance Comparison with Imbalanced Data : Recall Score (Noise added)

Burnup GWdMTU BOC (0.0) MOC (6.0) EOC (17.0)
Power rate [%] 60 80 100 60 80 100 60 80 100
50:50 0.616 0.640 0.708 0.623 0.649 0.703 0.638 0.658 0.742
50:10 0.650 0.699 0.881 0.670 0.704 0.894 0.707 0.717 0.897
50:5 0.667 0.716 0.923 0.685 0.742 0.932 0.710 0.743 0.938