Current Issue

Journal of the Korean Institute of Industrial Engineers - Vol. 50 , No. 1

[ Article ]
Journal of the Korean Institute of Industrial Engineers - Vol. 48, No. 5, pp. 499-508
Abbreviation: JKIIE
ISSN: 1225-0988 (Print) 2234-6457 (Online)
Print publication date 15 Oct 2022
Received 08 Mar 2022 Revised 27 Apr 2022 Accepted 22 Jun 2022
DOI: https://doi.org/10.7232/JKIIE.2022.48.5.499

예측 모델 기반 섀플리 값을 이용한 타이어 설계 인자 분석
황석철 ; 조윤상 ; 김성범
고려대학교 산업경영공학과

Tire Design Factor Analysis Using Predictive Model and Shapley Additive Explanations
Seok Cheol Hwang ; Yoon Sang Cho ; Seoung Bum Kim
Department of Industrial and Management Engineering, Korea University
Correspondence to : 김성범 교수, 02841 서울특별시 성북구 안암로 145, 고려대학교 산업경영공학과, Tel : 02-3290-3397, Fax : 02-3290-4550, E-mail : sbkim1@korea.ac.kr


© 2022 KIIE
Funding Information ▼

Abstract

In the tire manufacturing industry, factor analysis plays a crucial role in deriving design candidates that can increase tire performance by deriving design factors, including variable importance and directions of design change. Typically, expert knowledge and finite element analysis (FEA) are necessary to derive design factors. However, they required a high computation load. Although several studies have been performed using machine learning and variable selection methods, they have limitations in recommending design change directions for each variable. In this study, we propose a predictive model coupled with Shapley additive explanations (SHAP) for tire design factor analysis. We first construct a predictive model using tire design data, and then applied SHAP for deriving important variables and directions of design change. To demonstrate the effectiveness of our methodology, we evaluate the design candidates using FEA. Results show that our methodology is effective for a tire factor analysis.


Keywords: Tire, Factor Analysis, Predictive Model, Machine Learning, Shapley Additive Explanations

1. 서 론

본 연구는 타이어 설계 인자 중 차량 성능 기여도가 높은 중요 요인을 찾고 성능 상관관계를 분석하는 방법을 제안하는데 목적이 있다. 타이어 제조 산업에서의 설계 인자분석은 제품 성능 및 품질이 향상된 설계 사양을 고안하기 위해 매우 중요한 과업이다. 타이어는 도로와 차량이 맞닿는 유일한 부품으로 차량 전체 성능과 안전에 기여한다. 타이어는 하중 지지, 구동 및 제동력 전달, 충격 완화, 방향 전환(handling) 및 유지 등 차량 운행을 위한 필수적 기능을 수행하는 제품으로, 최근 전기 자동차 증가에 따른 승차감 향상 및 연비 개선을 위해 소음, 진동, 회전 저항을 최소화하는 제품 개발이 필수적으로 요구되고 있다(Nakajima, 2012). 타이어는 트레드(tread), 사이드 월(sidewall), 림 스트립(rim strip), 캡 플라이(cap ply), 스틸 벨트(steel belt), 카카스(carcass), 이너라이너(inner liner), 비드 필러(bead filler), 비드 와이어(bead wire)로 구성된다. 타이어 설계를 위해선 약 150개 설계 인자 값을 결정해야 하는데 각 변수 조합에 따라 타이어 성능 변화가 크다. 또한, 타이어 성능은 서로 상충관계(trade-off)를 갖는 다중 성능 변수를 고려해야 하기 때문에 적절한 설계 사양을 고안하기 위해 중요 변수 선택과 설계 변경 방향을 도출할 수 있는 설계인자 분석이 반드시 필요하다.

타이어 제조산업에서 설계 인자 분석은 주로 전문가의 경험적 지식에 의존하고 있다. 타이어 실험, 통계분석, 머신러닝을 이용해 여러 연구가 진행됐지만 중요 변수 선택과 설계 변경 방향을 제시하는데 한계가 있다. Thombare(2019)는 타이어의 압력, 하중, 속도, 내부 충진재의 변화에 따른 회전 저항 영향도를 타이어실험을 통해 확인하였다. 하중과 속도가 증가함에 따라 회전저항 및 내부 온도가 증가함과 타이어 내부 공기와 질소를 충진하여 회전 저항 및 온도 변화를 확인하였다. 아울러, 질소를 충진한 경우 공기에 비해 회전 저항이 낮고 타이어 내부 온도가 낮음을 확인하였다. Prakash et al.(2012)은 다구찌법(Taguchi method)을 이용하여 타이어 핸들링 성능을 향상시키는 설계인자의 최적설계를 수행하였다. 분산분석(analysis of variance, ANOVA) 분석 후 주효과도(main effect plot)를 이용해 설계인자 값에 따른 성능 개선 방향성을 확인하였으며, 유한요소해석(finite element analysis, FEA)을 활용하여 이를 검증하였다.

머신러닝 모델 기반 원인 분석 연구도 수행되었다. Lee et al.(2020)은 4개 타이어 설계데이터를 각 타이어 위치 정보에 따라 이미지 데이터로 변환하고, 합성곱신경망(convolutional neural network, CNN)을 적용하여 예측모델을 구축하였다. 또한, 클래스 활성화 맵(class activation map, CAM)을 통해 원인 인자를 도출하였고 이를 현업 엔지니어의 조언에 따라 유효성을 입증하였다. 설명변수는 동일한 조건에서 수집한 차량별 무게, 전륜 및 후륜 타이어 공기압, 차량 출력 등 이고, 반응변수는 타이어의 품질을 대표하는 16개 지표이다. Park et al.(2021)은 타이어 트레드 패턴 이미지와 트레드 깊이를 사용하여 타이어 마모 여부를 파악하고 손상 부위를 검출하는 CNN 모델을 제안하였다. CAM을 이용하여 마모도 분류 결과에 영향이 큰 요인을 확인하였으며, 손상 검출 모델을 활용하여 타이어 트레드, 비드, 사이드 월 손상을 높은 정확도로 검출하였다. 하지만 상기 연구들은 이미지 데이터 원인 분석방법론을 사용하였는데 설계인자 방향을 제시할 수 없을 뿐만 아니라 본 연구에서 다루는 정형데이터에 직접적으로 적용하기 어렵다는 한계점이 있다.

본 연구에서는 예측 모델 기반 SHAP (SHapley Additive exPlanations)을 이용한 타이어 설계 인자 분석 방법을 제안한다. SHAP은 변수 간 상관관계 및 부정적인 영향을 고려한 분석이 가능하기 때문에 상호 의존적인 설계 인자가 많고, 성능간 상충관계가 다수 존재하는 타이어 설계 인자 분석에 효과적이다. SHAP을 이용한 원인 인자 분석 연구는 Kim et al.(2021)이 컴퓨터 악성코드 그룹을 머신러닝을 활용하여 분류하였으며 SHAP을 활용하여 악성코드 그룹 분류에 대한 판단 근거를 분석하였다. 서로 다른 분류 모델의 SHAP 결과를 비교하여 유사성을 확인하였으며 악성코드 클래스의 주요 행위에 이용되는 API(application programming interface)와 SHAP을 통해 도출된 API를 비교하여 일치함을 확인함으로써 실용성을 증명하였다. Oh et al.(2021)은 산업 안전 보건 실태 설문조사 데이터를 활용하여 산업재해 예측 모델을 제안하였으며, SHAP을 활용하여 예측 결과를 설명하였다. 산업재해 발생에 영향도가 높은 요인을 도출하였으며 각 요인이 사고에 미치는 긍정 혹은 부정적인 영향을 분석하였다.

본 논문의 기여점은 다음과 같다. (1) 타이어 산업에서 설계인자 분석에 설명 가능한 인공지능을 적용한 첫 사례이다. (2) SHAP 분석 결과를 유한요소해석 방법을 이용하여 검증하였으며, 타이어 설계인자 분석 적용 가능성을 입증하였다. (3) SHAP 분석 결과를 활용하여 도메인 경험 여부에 무관하게 타이어 성능 개선 방향성을 제시할 수 있음을 확인하였다. (4) 타이어 설계데이터를 활용하여 성능을 예측할 수 있는 모델을 구축하였으며, 기존 방법론 대비 빠르고 정확한 예측값을 도출하였다. (5) 소재 및 재료명 등 범주형 데이터를 물성값으로 대체함으로써 데이터 불균형 해소 및 예측 시 신규 재료 적용 가능성을 확인하였다.


2. 연구 방법

본 연구에서는 SHAP을 이용하여 타이어 설계 인자를 분석하는 방법을 제안한다. 연구는 <Figure 1>과 같이 (1) 타이어 성능 예측모델 생성, (2) SHAP 분석 (3) 신규 설계 사양(design specification) 수립 및 FEA 이용한 타이어 성능 예측 및 검증 총 3단계로 구성된다.


Figure 1. 
Overview of the Methodology

첫 번째 단계로, 타이어 설계데이터를 활용하여 핸들링과 연비 성능 예측모델을 생성한다. SHAP은 예측모델이 도출한 결과에 대한 설명을 제공하는 방법이므로 예측 모델의 성능이 매우 중요하다. 설계데이터는 표 형태의 정형데이터이며, 두 가지 타이어 성능을 예측하는 다중회귀(multi-output regression) 문제로 정의할 수 있다. 이와 같은 문제에 강점이 있는 머신러닝과 딥러닝 모델을 비교 실험 후 가장 우수한 성능의 예측 모델을 선택하였다.

두 번째 단계는 생성된 예측 모델을 기반으로 SHAP 분석을 수행한다. SHAP은 특징 중요도(feature importance)와 부분의존성 플롯(partial dependence plots, PDP)의 단점을 개선한 방법으로 모든 머신러닝 모델에 적용이 가능하고, 기여도 높은 주요 인자 및 값 변화에 따른 결과의 영향을 사용자가 이해할 수 있도록 설명하는데 효과적인 기법이다(Lundberg et al., 2017). SHAP은 예측 결과에 대한 판단의 근거를 섀플리(Shapley) 값을 계산하여 설명한다. 섀플리 값은 협력게임이론(coalitional game theory)에서 제안된 방법으로 각 참여자의 게임 결과 기여도에 따라 보상을 할당하기 위해 참여자의 개별 기여도를 수치로 계산한 값이다(Lundberg et al., 2018). 섀플리 값은 식 (1)과 같이 하나의 특징 중요도를 확인하기 위해 여러 특징의 조합을 구성하고 해당하는 특징의 유무에 따른 평균적인 변화를 통해 계산할 수 있다.

i=SF\iS!F-S-1!F!fSixSi-fSxS(1) 

여기서 ∅ii번째 데이터에 대한 섀플리 값, F는 전체 집합, S는 전체 집합에서 i번째 데이터를 제외한 모든 부분 집합, fs∪ {i} (xS∪ {i})는 i번 데이터를 포함한 전체 기여도, fS(xS) i번째 데이터가 빠진 나머지 부분집합의 기여도이다(Molnar, 2018). SHAP 분석은 타이어 설계 인자별 섀플리 값을 구하고 값이 큰 순서로 기여도가 높다고 판단한다. 또한 설계 인자 값의 변화에 따른 타이어 성능 영향도 분석은 섀플리 값이 커지면 양(+), 작아지면 음(-)의 영향도가 있다고 판단한다.

세 번째 단계는 SHAP 결과를 근거로 성능이 향상된 타이어 설계 사양을 수립하고, FEA를 활용하여 타이어 성능을 확인한다. FEA를 통해 도출된 성능 개선 방향과 SHAP 결과를 비교하여 검증한다. FEA는 가상의 3차원 타이어를 이용하여 실제 타이어가 구동하는 상태를 시뮬레이션하는 방법이며 <Figure 2>와 같은 절차로 수행된다.


Figure 2. 
Steps of Simulation by Finite Element Method

먼저 가상의 타이어를 모델링하고, 수치 계산이 가능한 유한요소모델(finite element model)로 분할한다. 유한요소모델은 절점(node)과 요소(element)로 구성된다. 절점은 타이어 형상을 좌표로 표현하며, 수치 계산 시 결과를 포함한다. 요소는 절점을 연결하여 선, 면, 입체로 구성된다. 재료의 물성을 포함하고 있으며, 계산 결과를 가시적으로 표현하는 역할을 한다. 유한요소모델에 공기압, 하중, 속도 등 타이어의 구동조건을 부여한 후 유한요소법(finite element method)으로 수치 계산을 수행한다. 수치계산을 결과로 절점 및 요소에 작용하는 힘, 변위(displacement), 응력(stress), 변형률(strain) 등 기계적, 물리적 특성값을 얻을 수 있다(Korunović et al., 2011).


3. 타이어 성능 예측 모델 생성
3.1 데이터

설명변수는 총 56개이며 타이어 형상 치수 및 시험조건 그리고 재료의 명칭으로 구성되어있다. 전체 설명변수의 명칭은 기업 보안 이슈 상 공개할 수 없으나, <Figure 3>에 타이어 단면 및 대표적인 치수와 재료를 나타내었다. 설명변수 중 타이어 형상 치수는 전체 직경(outer diameter), 폭(section width), 단면 높이(section height), 림 폭(rim width) 등 길이를 표현하는 수치값이며, 타이어 재료의 명칭은 트레드, 사이드월, 비드필러 등 고무 재료(compound)와, 스틸벨트, 카카스, 캡 플라이 등 복합재(cord)를 구분하기 위한 문자열 값이다. 앞서 언급한 바와 같이 설계 시 결정해야 하는 설계 인자는 약 150개이며, 모든 설계 인자 값을 결정하는 것은 매우 어렵다. 따라서 다수의 타이어 제조업체에서는 설계 편의성 향상을 위해 설계 인자 간 상호관계를 수식으로 정의하여 종속변수로 변환함으로써 결정해야 하는 설계 인자의 수를 축소한다. 이렇게 축소된 설계 인자를 설명변수로 사용하였다.


Figure 3. 
Cross-sectional View of Tire with Dimension and Materials Components

반응변수는 코너링강성(cornering stiffness, CS)과 회전저항계수(rolling resistance coefficient, RRc)로 실차시험의 핸들링과 연비 성능을 대변하는 실내시험의 평가지표이다. 실차시험은 시험 준비 시간 및 비용 손실이 크기 때문에 실차시험과 유사한 시험 조건을 실내에 구현하여 실험하고 있다. 실내시험 조건 및 방법은 차량 제조사 및 공인기구에서 표준화되어있다. <Figure 4>는 CS와 RRc 실내시험 시 타이어에 작용하는 힘을 도식적으로 표현한 자유물체도(free body diagram)다. CS는 차량의 직진 상태를 구현한 후 좌/우 방향으로 15도 회전시켰을 때 휠 중심에서 발생하는 측면 방향 힘을 측정하고 ±1도 회전했을 때 기울기를 계산한 값으로 클수록 핸들링 성능이 우수하다고 평가한다. RRc는 차량의 직진 주행상태를 구현하고 휠 중심에서 직진 방향 힘을 측정 후 하중으로 나눈 값으로 작을수록 연비 성능이 우수하다고 평가한다(Hall et al., 2001; Jung et al., 2018).


Figure 4. 
Free Body Diagram of Cornering Stiffness and Rolling Resistance Indoor Test

3.2 데이터 전처리

본 연구에 사용한 설계데이터는 입력 오류, 누락 및 단위의 불일치 등 결측치와 이상치를 다수 포함하고 있으며, 설명변수는 수치형과 범주형 데이터가 혼재되어있다. 결측치처리는 반응변수의 경우 해당 데이터를 삭제하였으며, 설명변수의 경우 결측치와 가장 가까운 1개의 데이터를 찾아 대체하였다. 타이어 제조업체에서는 설계 시 목표 성능에 근접한 설계 사양을 기초로 설계 인자 값을 변경하기 때문에 결측치를 포함한 데이터와 유사한 설계 사양이 존재할 것으로 판단하였다. 실험적으로도 실제 값이 존재하는 100개의 데이터를 무작위 삭제하여 결측치를 생성하고 1~10개의 근접데이터에 대해 실험을 수행하였으며 그 결과 1개의 최근접 데이터를 찾아 대체한 경우 실제값과의 오차가 가장 작음을 확인하였다. 이상치는 각 설계 인자 별 사분위수 범위(inter quartile range, IQR)값에 가중치 1.5를 곱한 값을 계산하여 최소, 최대 제한값 기준으로 정하고 최소 기준 보다 작거나 최대 기준 보다 큰 값을 이상치로 분류하였다. 이상치로 분류된 데이터는 직접확인하여 수정 및 삭제하였다.

설명변수는 형상 치수와 시험조건 등 수치형 변수와 재료명과 같은 범주형 변수를 포함하고 있다. 볌주형 변수는 일반적으로 원-핫 인코딩(one-hot encoding) 기법을 활용하지만 본 연구에서는 재료의 인장, 압축, 점탄성 시험을 통해 수집한 수치형 물성값으로 대체하였다. 범주형 데이터를 재료의 물성값으로 대체함으로써 재료의 사용 빈도에 대한 데이터 불균형을 해소할 수 있으며, 재료의 물리적 특성을 고려한 예측모델을 생성할 수 있다. 또한 일반적으로 모델의 정확도 향상을 위해 데이터의 값이 일정범위 내 값을 갖도록 정규화(normalization)및 표준화(standardization)를 수행한다. 그러나 치수 및 물성데이터의 경우 설명변수 간 차이를 고려해야 하고, 값 단위의 차원이 유사하기 때문에 데이터의 정규화 및 표준화는 수행하지 않았다. 최종적으로 전처리가 완료된 총 데이터는 16,317개이며 <Table 1>과 같다.

Table 1. 
Summary of Tire Design Dataset
Description Variable Name
Explanatory variables Tire dimension (outer diameter, etc.) X01, ..., X32
Material properties (rubber and cord, etc.) M01, ..., M20
Indoor test conditions (pressure, etc.) T1, ..., T4
Response variables Tire performances (CS, RRc) CS, RRc

3.3 예측 모델 생성

전처리가 완료된 타이어 설계데이터를 활용하여 예측 모델을 생성하였다. 전체 데이터의 80%는 학습데이터로, 나머지 20%는 모델 평가를 위한 데이터로 분리하였다. 예측모델은 선형회귀(linear regression), 엘라스틱넷(elastic net; Zou et al., 2005), 의사결정나무(decision tree; Breiman et al., 2017), 랜덤포레스트(random forest; Ho, 1995), 캣부스트(catboost; Prokhorenkova et al., 2018), 라이트지비엠(light GBM; Ke et al., 2017), 5개의 은닉층(hidden layer)을 갖는 심층신경망(deep neural network, DNN) 모델을 실험에 사용하였다. 실험은 학습데이터와 평가데이터를 무작위 분할하여 10회 반복 수행하였으며, 선형회귀를 제외한 각 모델의 하이퍼파라미터(hyperparameter )를 격자 탐색(grid search; Bergstra et al., 2011) 방법을 사용하여 결정하였다. 탐색은 임의 범위를 선정하여 탐색하고, 우수한 하이퍼파라미터 값 근처의 범위를 재탐색하였다. 각 모델별 하이퍼파라미터 탐색 범위 및 값을 <Table 2>에 표시하였다. DNN 모델은 동일한 노드 수를 갖는 은닉층을 1~20개 변경하여 실험하였으며, 1,000번의 에폭(epoch) 중 손실함수의 값이 가장 작은 모델을 선정하였다.

Table 2. 
The Range and Optimal Values of Hyperparameters for Predictive Models.
Predictive Models Hyperparameter Name Range Optimal Value
ElasticNet alpha
l1_ratio
max_iter
0.0001, 0.001, 0.01, 0.1, 1, 10
0.002, 0.02, 0.1, 1
0, ⋯ , 10 (spacing :1)
0.0001
0.1
9
Decision tree max_depth
min_samples_leaf
min_samples_split
0, ⋯ , 10 (spacing :1)
0, ⋯ , 10 (spacing :1)
0, ⋯ , 10 (spacing :1)
9
3
5
Random forest max_depth
min_samples_split
min_samples_leaf
n_estimators
0, ⋯ , 10 (spacing :1)
0, ⋯ , 10 (spacing :1)
0, ⋯ , 10 (spacing :1)
0, ⋯ , 1000 (spacing :100)
9
8
8
900
CatBoost depth
learning_rate
l2_leaf_reg
0, ⋯ , 10 (spacing :1)
0.002, 0.02, 0.1
0.2, 0.5, 1, 3, 5
8
0.1
3
LightGBM learning_rate
max_depth
n_estimators
0.002, 0.02, 0.1
0, ⋯ , 10 (spacing :1)
0, ⋯ , 1000 (spacing :100)
0.1
9
900

예측모델의 성능 평가는 결정계수(R-squared, R2)와 평균절대오차(mean absolute error, MAE), 평균제곱오차(mean squared error, MSE)를 사용하였으며 각 평가 지표는 수식은 (2) ,(3), (4)와 같다.

R2=1-n=1Nyn-y^n2n=1Nyn-y^2(2) 
MAE=1Nn=1Nyn-y^n(3) 
MSE=1Nn=1Nyn-y^n2(4) 

여기서, yn는 n번째 관측치에 대한 실제값, y^n은 n번째 관측치에 예측값, N은 전체 관측치 수이다. 결정계수는 0과 1사이 값을 가지며, 1에 가까울수록 실제값과 예측값의 상관관계가 큼을 의미한다. 평균절대오차는 반응변수의 실제값과 예측값의 오차값을 평균한 값으로 0에 가까울수록 예측값과 실제값의 차이가 작음을 의미한다. 평균제곱오차는 반응변수 실제값과 예측값 오차의 제곱을 평균으로 나눈값이며 큰 예측오차에 패널티를 주는 측도이다.

실험결과는 <Table 3>에서 보여준다. 예측모델의 평가지표는 반복 실험결과의 평균값을 표기하였으며 표준편차를 괄호 안에 나타내었다. 실험 결과 앙상블 방법 중 배깅(bagging)방식의 랜덤 포레스트, 부스팅(boosting)방식의 캣부스트, 라이트지비엠 모델의 성능이 우수함을 확인하였으며, 캣부스트 모델이 결정계수 기준 CS 0.971±0.001, RRc 0.951±0.003의 값으로 가장 우수하고 강건한 모델임을 확인하였다.

Table 3. 
Comparison of Predictive Models in Terms of R2, MAE, and MSE. Standard Errors are Shown in Parentheses. Boldface Values Represent the Highest Performance among Predictive Models
Predictive Models CS RRc
R2 MAE MSE R2 MAE MSE
Linear regression 0.925
(0.007)
53.002
(1.274)
5052.402
(469.305)
0.846
(0.003)
0.377
(0.004)
0.233
(0.005)
ElasticNet 0.898
(0.009)
62.421
(2.284)
6712.511
(572.285)
0.610
(0.007)
0.602
(0.011)
0.604
(0.025)
Decision tree 0.955
(0.002)
32.531
(1.271)
2913.226
(216.757)
0.921
(0.004)
0.217
(0.004)
0.120
(0.006)
Random forest 0.969
(0.005)
29.464
(1.736)
2028.001
(361.001)
0.946
(0.002)
0.191
(0.003)
0.081
(0.003)
CatBoost 0.971
(0.001)
28.895
(0.872)
1853.270
(122.806)
0.951
(0.003)
0.196
(0.003)
0.074
(0.005)
LightGBM 0.969
(0.003)
30.212
(1.298)
2035.431
(254.886)
0.944
(0.003)
0.210
(0.003)
0.085
(0.005)
DNN 0.895
(0.012)
63.384
(4.189)
6911.923
(873.528)
0.790
(0.038)
0.439
(0.047)
0.319
(0.059)

3.4 SHAP 분석

SHAP을 활용하여 설계인자를 분석하였다. 먼저 실험에 사용한 모든 타이어 예측결과에 대해 분석할 수 있는 전역분석(global interpretation)을 수행하여 중요 설계 인자를 도출하고 값 변화에 따른 반응변수 영향도를 확인하였다. 이어 타이어 개발 수요가 많고 고성능 타이어 개발의 기초 설계 사양으로 활용성이 높은 215/45R17 크기의 타이어에 대해 한 개의 예측결과에 대해서만 분석할 수 있는 국소분석(local interpretation)을 수행하였다. 타이어 크기 표기에서 첫 번째 값은 타이어의 폭, “/”은 구분기호, 두 번째 값은 폭 대비 높이 비율, “R”은 레이디얼(radial) 타이어 구조를 의미하고, 마지막 값은 휠 직경의 인치 단위 값이다.

전역분석은 모든 예측결과에 대해 타당한 분석결과를 제공하는 점에서 유용하지만, 개별 예측결과에 대한 분석력은 부족하다. 반면 개발 타이어에 대한 국소분석은 전반적인 예측결과에 대한 분석은 불가능하지만, 분석 범위가 작아 분석에 소요되는 시간 손실이 적고 분석결과 신뢰성이 높다. <Figure 5>는 전역분석 결과이며, 전체 설명변수 중 중요도 높은 상위 10개를 표시하였다. CS는 실내시험조건, 타이어 형상 치수, 재료 순으로 기여도가 높음을 알 수 있으며, T03, T01, X28, X01, X03, X31, X30, M01, X05, T02가 중요 설명변수로 도출되었다. T03, T01, X28, X01, X03, X30, M01, X05, T02 값은 클 수록 CS값이 커지고, X31 값은 클수록 CS값이 작아진다. RRc는 재료, 타이어 형상 치수, 실내시험조건 순으로 기여도가 높았으며 중요 설명변수는 M06, X01, T03, M03, T02, M09, M16, M05, X24, X27가 도출되었다. M06, M03, M09, M16, X24, X27은 값이 작을수록 RRc가 작아지고, X01, T03, T02, M05은 값이 작을수록 RRc이 커진다.


Figure 5. 
SHAP Plots for All Tires (Global Interpretation)

<Figure 6>은 특정 215/45R17 타이어에 대한 결과이다. 전역분석 결과와 기여도 순위의 차이는 있었지만 중요 설명변수는 동일하게 도출되었다. 그러나 값에 대한 영향도는 차이가 있었다. CS는 X28과 X30의 영향도가 달랐다. X28의 경우 전역분석 결과에서 값이 클수록 CS가 증가하였지만 215/45R17 타이어 분석에서는 감소하였다. X30의 경우 전역분석 결과에서 값이 클수록 CS가 감소하였지만, 215/45R17 결과에서는 증가하였다. RRc의 경우X01, T03, T02의 영향도가 달랐다. X01의 경우 전역분석에서 값이 클수록 RRc가 감소하였지만, 215/45R17에서는 증가하였으며, T03, T02의 경우 전역분석에서 값이 클 수록 RRc가 감소하였지만, 215/45R17에서는 증가하였다. 해당 결과를 바탕으로 215/45R17크기의 타이어의 핸들링과 연비 성능을 개선하려면 (1) CS 기여도가 높은 X30, X03, X31, X05의 값을 증가, X28을 감소하여 핸들링 성능을 향상 시키고, (2) RR 기여도가 높은 X24, X27은 값은 감소시키고, M06, M09, M03이 작고, M16이 큰 재료를 선택하여 연비 성능을 향상 시킬 수 있음을 알 수 있다. X01의 경우 CS와 RRc가 상충관계에 있기 때문에 성능 개선 시 활용이 어려운 설명변수로 판단할 수 있다. T01, T02, T03의 경우는 시험조건에 해당되는 설명변수로 설계 시 활용이 어렵다.


Figure 6. 
SHAP Plots for the 215/45R17 Tire (Local Interpretation)

SHAP 방법 외 설명변수의 중요도는 모델의 학습과정에서 쉽게 도출이 가능하다. 학습과정에서 도출된 중요 설명변수는 M06, T03, X01, M05, M09, M16, M03, M01, X22, M13으로 T03, X01, M01 외 중요 설명변수가 SHAP 분석 결과와 일치하지 않았다. 도메인 지식에 비추어 중요도를 정성적으로 판단하면 SHAP의 결과가 우수하다고 판단된다. SHAP 방법의 경우 반응변수 기여도가 높은 것으로 알려진 타이어 시험조건 및 주요 형상 치수 설명변수를 포함하고 있다. 그러나 학습과정에서 도출된 중요 설명변수의 경우 기여도가 낮다고 알려진 재료의 물성을 중요 설명변수로 도출하였다.


4. FEA를 활용한 SHAP 분석 결과 검증

본 연구에서는 SHAP 분석 결과의 타당성 검증을 위해 215/45R17 타이어를 기초 설계사양으로 선정하고, 3.3장에서 도출한 중요 형상 설명변수를 8인자 3수준, 재료 설명변수를 6인자 3수준으로 실험계획을 수립하였다. 검증을 위해서는 실제 타이어를 제작하여 실내시험을 수행하고 결과를 비교하는 방법이 가장 정확하나 이는 타이어 제작 및 시험 수행에 따른 비용 및 시간 소모가 크기 때문에 비현실적이다. 따라서 본 연구에서는 시제품 제작 및 시험을 FEA 방법으로 대체하여 CS와 RRc 값을 확인하였다. FEA는 타이어 개발 시 성능을 사전에 예측하기 위한 방법으로 많은 타이어 제조업체에서 활용하고 있다.

중요 타이어 형상 및 재료 설명변수의 실험계획과 FEA결과를 <Table 4>, <Table 5>에 각각 정리하였다. 기초 설계 사양은 215/45R17 SHAP 분석에 사용된 사양과 동일하며, 타이어 제조업체의 정보보안을 위해 일부 수치는 절대값 대신 실험 수준으로 변경하여 표기하였다.

Table 4. 
Design of Experiments for Tire Shape Design Factors
Design Specification FEA Result
X1 X03 X05 X24 X27 X28 X30 X31 CS RRc
Base Design 627 222 218.3 10 1 4 25 1 1401.30 8.60
Design 1 624 222 218.3 10 1 4 25 1 1404.59 8.81
Design 2 630 222 218.3 10 1 4 25 1 1399.89 8.47
Design 3 627 219 218.3 10 1 4 25 1 1411.35 8.77
Design 4 627 225 218.3 10 1 4 25 1 1397.30 8.48
Design 5 627 222 192.9 10 1 4 25 1 1385.4 7.71
Design 6 627 222 243.7 10 1 4 25 1 1417.68 9.01
Design 7 627 222 218.3 7 1 4 25 1 1397.72 7.98
Design 8 627 222 218.3 13 1 4 25 1 1404.89 8.82
Design 9 627 222 218.3 10 2 4 25 1 1409.06 8.93
Design 10 627 222 218.3 10 3 4 25 1 1411.00 9.05
Design 11 627 222 218.3 10 1 2 25 1 1374.95 8.45
Design 12 627 222 218.3 10 1 3 25 1 1383.73 8.50
Design 13 627 222 218.3 10 1 4 23 1 1432.08 8.14
Design 14 627 222 218.3 10 1 4 27 1 1375.67 8.75
Design 15 627 222 218.3 10 1 4 25 2 1463.04 9.10

Table 5. 
Design of Experiments for Materials
Design Specification FEA Result
M01 M03 M05 M06 M09 M16 CS RRc
Base Design 1 1 1 1 1 1 1401.30 8.60
Design 1 2 1 1 1 1 1 1404.18 8.65
Design 2 3 1 1 1 1 1 1407.06 8.64
Design 3 1 2 1 1 1 1 1401.85 8.61
Design 4 1 3 1 1 1 1 1402.40 8.65
Design 5 1 1 2 1 1 1 1404.01 8.68
Design 6 1 1 3 1 1 1 1406.69 8.62
Design 7 1 1 1 2 1 1 1400.70 8.85
Design 8 1 1 1 3 1 1 1400.65 9.10
Design 9 1 1 1 1 2 1 1400.42 8.70
Design 10 1 1 1 1 3 1 1400.30 8.83
Design 14 1 1 1 1 1 2 1401.24 8.73
Design 15 1 1 1 1 1 3 1401.13 9.22

SHAP을 통해 도출한 중요 설명변수의 성능 영향도 검증을 위해 FEA 및 SHAP 결과의 주효과도를 확인하여 방향성 일치 여부를 비교하였으며, FEA 경향과 SHAP 영향도의 경향이 일치하면 타당한 것으로 판단하였다. SHAP 주효과도를 표시하지 않은 설명변수는 중요도가 낮은 설명변수 혹은 영향도 분석이 어려운 설명변수다. <Figure 7>은 중요 형상 설명변수 값 변화에 따른 CS와 RRc 값 주효과도이다. 비교 결과 X05, X28, X31, X24, X27의 영향도가 일치하였으나 X01, X03, X30은 불일치하였으며 도메인 경험에 비추어 볼 때 FEA 결과가 더 타당하다. X01, X03, X30의 값이 증가할 경우 타이어 전체 강성이 약해지기 때문에 방향 전환에 따른 힘 전달속도가 느려지고 따라서 CS값이 작아진다. 반면, RRc의 경우 X01의 경우 강성이 약해질수록 완충효과로 인해 RRc 값은 작아진다.


Figure 7. 
Main Effects Plot of Tire Shape Explanatory Variables

<Figure 8>은 중요 타이어 재료 설명변수 값 변화에 따른 CS와 RRc 값 주효과도다. M16, M05의 영향도는 일치여부를 판단할 수 없으나 M01, M03, M06, M09, M16의 경향은 모두 일치하였다. 실제로 M01, M03, M06, M09, M16은 타이어 제조업체에서 핸들링 및 연비에 영향도가 큰 설명변수이며, 타이어 재료 개발 시 가장 우선적으로 확인하는 변수들이다. 또한 설명변수 값 변화에 따른 SHAP 영향도 일치한다.


Figure 8. 
Main Effects Plot of Tire Material Explanatory Variables.


5. 결 론

본 연구에서는 SHAP을 활용하여 타이어 성능에 기여도가 높은 중요 설계 인자를 도출하고 각 설계 인자 값에 따른 타이어 핸들링 및 연비 성능의 경향을 파악하였으며, FEA를 활용하여 타당성을 검증하였다. 재료 설계 인자의 경우 SHAP 결과와 FEA 결과가 대부분 일치하였으며, 실제로 타이어 제조업에서 타이어 개발 시 우선적으로 고려하는 중요 설명 인자와 값 변화에 따른 CS, RRc 방향을 정확하게 도출하였다. 다만, 타이어 형상 설계 인자의 경우 SHAP 분석 결과와 FEA 결과의 영향도가 일부 불일치하였으나, 다수 설계인자가 일치하였고, 실제 타이어 설계 시 변경하는 설계 인자를 정확하게 도출하였다. 본 연구를 통해 SHAP이 FEA를 활용한 실험계획법 보다 효율적이고, 객관적으로 중요 설계 인자를 도출할 수 있으며, 성능이 개선된 타이어 설계 사양을 고안하는데 올바른 방향성을 제시해 줄 수 있는 방법론임을 확인하였다. 추가적으로 실제 타이어 설계데이터를 활용하여 정확도 높은 타이어 성능 예측 모델을 생성하였으며 타이어 성능 예측 시 FEA를 대체하는 효과도 크다. 향후 정형데이터를 활용한 SHAP 분석 과업에서 예측 모델의 정확성과 SHAP 결과의 상관성을 규명하여 학습 방법에 따른 SHAP 결과의 차이점을 추가적으로 분석하고자 한다.


Acknowledgments

This research was supported by BK21 FOUR.


References
1. Bergstra, J., Bardenet, R., Bengio, Y., and Kégl, B. (2011), Algorithms for hyper-parameter optimization, Advances in Neural Information Processing Systems, 24.
2. Breiman, L., Friedman, J. H., Olshen, R. A., and Stone, C. J. (2017), Classification and regression trees, Routledge.
3. Hall, D. E. and Moreland, J. C. (2001), Fundamentals of rolling resistance, Rubber Chemistry and Technology, 74(3), 525-539.
4. Ho, T. K. (1995, August), Random decision forests, In Proceedings of 3rd International Conference on Document Analysis and Recognition, IEEE, 1, 278-282.
5. Jung, S. P. and Jo, J. H. (2018), Test method of rolling resistance of a tire considering cornering condition, Transactions of the Korean Society of Automotive Engineers, 26(6), 736-744.
6. Ke, G., Meng, Q., Finley, T., Wang, T., Chen, W., Ma, W., and Liu, T. Y. (2017), Lightgbm: A highly efficient gradient boosting decision tree, Advances in Neural Information Processing Systems, 30.
7. Kim, D. Y., Jeong, A. Y., and Lee, T. J. (2021), Analysis of malware group classification with eXplainable artificial intelligence, Journal of the Korea Institute of Information Security and Cryptology, 31(4), 559-571.
8. Korunović, N., Trajanović, M., Stojković, M., Mišić, D., and Milovanović, J. (2011), Finite element analysis of a tire steady rolling on the drum and comparison with experiment, Strojniški vestnik-Journal of Mechanical Engineering, 57(12), 888-897.
9. Lee, Y. J., Cho, Y. S., Choi, J. H., and Kim, S. B. (2020), Convolutional neural network model for tire quality prediction and cause analysis, Journal of the Korean Institute of Industrial Engineers, 46(5), 539-547.
10. Lundberg, S. M. and Lee, S. I. (2017), A unified approach to interpreting model redictions, Advances in Neural Information Processing Systems, 30.
11. Lundberg, S. M., Erion, G. G., and Lee, S. I. (2018), Consistent individualized feature attribution for tree ensembles, arXiv preprint arXiv, 1802.03888.
12. Molnar, C. (2018), A guide for making black box models explainable, URL: Https://Christophm. Github. Io/Interpretable-Ml-Book.
13. Nakajima, Y. (2012), Current status and future of tire technology, Nippon Gomu Kyokaishi, 85(6), 178-182.
14. Oh, H. R., Son, A. L., and Lee, Z. K. (2021), Occupational accident prediction modeling and analysis using SHAP, Journal of Digital Contents Society, 22(7), 1115-1123.
15. Park, H. J., Lee, Y. W., and Kim, B. G. (2021), Efficient tire wear and defect detection algorithm based on deep learning, Journal of Korea Multimedia Society, 24(8), 1026-1034.
16. Prakash, J., Bankar, A., Unnikrishnan, G., and Thomas, T. (2012), Optimization of tire design and construction parameters for handling, HyperWorks Technology Conference.
17. Prokhorenkova, L., Gusev, G., Vorobev, A., Dorogush, A. V., and Gulin, A. (2018), CatBoost: Unbiased boosting with categorical features, Advances in Neural Information Processing Systems, 31.
18. Thombare, D. G. (2019), Analysis of effect of tire inflation pressure, inflation fluids, load and speed on tire performance, SAE Technical Paper, No. 2019-26-0368.
19. Zou, H. and Hastie, T. (2005), Regularization and variable selection via the elastic net, Journal of the royal statistical society: Series B (statistical methodology), 67(2), 301-320.

저자소개

황석철 : 동아대학교 기계공학과에서 2012년 석사학위를 취득하고, 고려대학교 산업경영공학과에서 석사과정에 재학중이다. 현재 넥센타이어 중앙연구소에서 재직 중이며, 연구분야는 딥러닝, 머신러닝, Explainable AI이다.

조윤상 : 한국외국어대학교 산업경영공학과에서 2017년 학사학위를 취득하고, 고려대학교 산업경영공학과에서 2022년 박사학위를 취득하였다. 현재 뉴욕대학교 의과대학 인구보건학과 박사후 연구원으로 재직중이며, 연구분야는 Predictive & Explainable Modeling, Adversarial Machine Learning, Algorithmic Fairness이다.

김성범 : 고려대학교 산업경영공학부 교수로 2009년부터 재직하고 있으며, 인공지능공학연구소 소장 및 기업산학연협력센터 센터장을 역임했다. 미국 University of Texas at Arlington 산업공학과에서 교수를 역임하였으며, 한양대학교 산업공학과에서 학사학위를 미국 Georgia Institute of Technology에서 산업공학 석사 및 박사학위를 취득하였다. 인공지능, 머신러닝, 최적화 방법론을 개발하고 이를 다양한 공학, 자연과학, 사회과학 분야에 응용하는 연구를 수행하고 있다.