- HOME
- About
- Browse Archives
- Current Issue
- For Authors and Reviewers
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
์ฃ์กํฉ๋๋ค.
ํ์๋์ ๋ ผ๋ฌธ ์ด์ฉ ๊ถํ์ด ์์ต๋๋ค.
๊ถํ ๊ด๋ จ ๋ฌธ์๋ ํํ๋ก ๋ถํ ๋๋ฆฝ๋๋ค.
| [ Article ] | |
| Journal of the Korean Institute of Industrial Engineers - Vol. 51, No. 5, pp. 363-375 | |
| Abbreviation: JKIIE | |
| ISSN: 1225-0988 (Print) 2234-6457 (Online) | |
| Print publication date 15 Oct 2025 | |
| Received 10 Feb 2025 Revised 20 Aug 2025 Accepted 01 Sep 2025 | |
| DOI: https://doi.org/10.7232/JKIIE.2025.51.5.363 | |
| 멀티 태스크 그래프 어텐션 네트워크를 활용한 효율적인 피겨 스케이팅 데이터 분석 | |
이다인 ; 김수현†
| |
| 경북대학교 데이터사이언스대학원 | |
Efficient Figure Skating Data Analysis using Multi-Task Graph Attention Networks | |
Dain Lee ; Suhyeon Kim†
| |
| Graduate School of Data Science, Kyungpook National University | |
| Correspondence to : †김수현 교수, 41566, 대구광역시 북구 대학로 80 경북대학교 데이터사이언스대학원, Tel : 053-950-6523, E-mail : suhyeonkim@knu.ac.kr | |
© 2025 KIIE | |
Funding Information ▼ | |
Figure skating scoring relies on human judgment, leading to subjectivity and bias, highlighting the need for an objective scoring system. In this study, we propose a multi-task graph attention network to simultaneously classify figure skating movements into four tasks: major action category, sub-action category, skill success/failure, and skater skill level. We constructed a heterogeneous directed skeleton graph which consist of joint nodes with (x, y) coordinates and two types of edges, bidirectional spatial edges between each joints and unidirectional temporal edges to represent the temporal flow of the same joint. Using only lower-body data, our model achieved the best cross-entropy loss, accuracy, and efficiency in terms of time complexity, data utilization, and task performance. In future work, we aim to extend the model for real-time evaluation in a real-world competition environment.
| Keywords: Figure Skating, Skeleton-based Action Recognition, Graph Attention Networks, Multi-Task Learning, Motion Classification |
|
스포츠 산업은 빠르게 변화하는 데이터 중심 환경에서 새로운 기술과 방법론을 적극적으로 도입하고 있다. 전통적인 스포츠 관리 및 평가 방식은 경험과 직관에 의존하는 경우가 많았으나 최근 선수들의 경기력 데이터, 생체 신호, 훈련 기록, 경기 영상 등 다양한 데이터를 분석함으로써 보다 정량적이고 체계적인 의사결정이 가능해지고 있다. 인공지능과 빅데이터의 발전은 스포츠 경기력 향상, 선수 관리, 관중 경험 개선, 그리고 스포츠 산업의 전반적인 운영 최적화에 중요한 역할을 하고 있으며, 데이터 분석을 활용하여 판정 오류를 줄이고 경기의 공정성을 강화하는 심판 판정 보조 시스템 또한 스포츠 산업에서 핵심 화두에 있다(Feng, 2023; Mataruna-Dos-Santos et al., 2020).
본 연구에서는 이러한 기술의 도입이 필요한 대표적인 스포츠 종목으로 피겨 스케이팅에 초점을 맞추었다. 피겨 스케이팅은 동계 올림픽 정식 종목 중 가장 오래된 스포츠로, 빙판 위에서 개인, 페어, 또는 단체가 기술과 예술을 선보이는 종목이다(International Olympic Committee, 2025). 주요 종목으로는 여자 싱글, 남자 싱글, 페어, 그리고 아이스 댄싱이 있다. 올림픽 공식 홈페이지에 따르면, 피겨 스케이팅의 최종 점수는 기술 점수와 예술 점수의 합에서 넘어짐, 시간 초과 등 실수로 인한 감점을 제외한 값으로 산출된다. 기술 점수는 2명의 테크니컬 전문가와 1명의 테크니컬 컨트롤러로 구성된 패널이 평가하며, 예술 점수와 수행 능력은 9명의 심판 패널이 평가한다. 이는 사람이 기술을 평가하는 방식으로, 심사위원의 주관적 판단에 따라 편향과 채점 오류가 존재할 수 있다(Tanaka et al., 2023; Lee et al., 2016). 이러한 한계를 극복하고 더 정확하고 일관된 점수를 평가할 수 있는 프로그램의 필요성이 제기된다.
최근 피겨 스케이팅 또한 데이터 기반 분석 연구가 활발하게 진행되고 있으며, 경기력 평가 및 동작 분류를 위한 다양한 접근 방식이 시도되고 있다. Bai (2023)은 비디오 분류 기법을 활용하여 피겨 스케이팅 점프 동작을 추적하고 분석하는 모델을 제안하였다. 또한, Xu et al.(2019)은 비디오 데이터를 활용하여 피겨 스케이팅 경기 점수를 자동으로 예측하는 딥러닝 모델을 개발하고 이를 통해 기존의 주관적인 심사 방식과 비교하여 보다 일관된 채점 시스템의 가능성을 탐색하기도 하였다. 이러한 연구들은 비디오 기반 분석 기법을 활용하여 피겨 스케이팅 동작을 자동으로 인식하고 평가할 수 있는 가능성을 제시하였으나, 카메라 위치, 조명, 선수 의상 등 외부 요인에 의해 성능이 영향을 받을 가능성이 크다는 한계를 가진다. 이를 해결하기 위해, 본 연구에서는 선수의 신체 관절 데이터를 활용한 스켈레톤 기반 동작 인식(Skeleton-Based Action Recognition) 기술의 활용을 적용하고자 한다.
스켈레톤 기반 동작 인식은 인간-컴퓨터 상호작용, 비디오 분석 등 다양한 분야에서 중요한 역할을 하고 있다. 초기에는 사람이 동작의 특성을 설계하여 분석하였다(Vemulapalli et al., 2014; Ofli et al., 2014). 딥러닝의 발전과 함께 재귀 신경망(Recurrent Neural Networks) (LanZhang et al., 2017; Du et al., 2015) 및 합성곱 신경망(Convolutional Neural Networks) (Li et al., 2017; Kim and Reiter, 2017)을 기반으로 스켈레톤 데이터를 벡터 시퀀스나 의사 이미지로 구조화하여 분석하는 방식이 도입되었다. 그러나 이러한 방법은 스켈레톤의 그래프 구조를 효과적으로 모델링하기에는 부족한 점이 존재했고, 성능 개선의 여지가 존재했다. 최근에는 그래프 구조를 활용하는 그래프 신경망(Graph Neural Networks, GNN)이 각광받고 있으며, 관절관 의미론적 관계를 더 잘 포착하여 기존 방법들보다 우수한 성능을 보이고 있다(Yan et al., 2018; Myung et al., 2024). 그러나 이를 피겨 스케이팅 동작 분류에 활용하기 위해서는 다음과 같은 주요 과제가 존재한다. 첫째로, 동작 및 기술을 잘 표현할 수 있는 적합한 스켈레톤 그래프의 구조화가 필요하다. 또한, 이러한 그래프 구조를 효과적으로 학습할 수 있는 그래프 신경망 모델을 디자인하여야 한다. 더하여, 심층 딥러닝 모델의 실제 활용성을 높이기 위해 학습 및 추론에서의 효율성을 강화하는 전략을 도입해야 한다.
따라서, 본 연구는 앞서 언급한 주요 과제를 고려한 멀티 태스크 그래프 신경망 기반 피겨 스케이팅 동작 분류 모델을 제안한다. 본 연구에서는 데이터의 관절들 사이의 관계와 시간의 흐름에 따른 관계를 그래프로 나타내어 동작 분류 모델링에 도입하고자 한다. 특히, 그래프 기반 피겨 스케이팅 동작 데이터 분석에서 효율성을 강화할 수 있는 접근법을 제안한다. 첫째로, 전체 신체 관절 노드를 전부 활용하는 것이 아닌, 동작 및 기술의 핵심이 있는 하반신과 관련된 데이터만을 분석에 활용한다(Kwon and Lee, 2015; Koga et al., 2025; Li and Cao, 2024). 둘째로, 멀티 태스크 학습 방식(Multi-task Learning, MTL)을 도입한다. 본 연구에서는 피겨 스케이팅 기술의 대분류와 소분류, 기술의 성공 여부, 시연자의 숙련도 총 네 가지 태스크를 동시에 분류하고자 한다. 이를 각각의 싱글 태스크 학습 모델(Single Task Learning, STL)로 학습하는 것이 아닌, 하나의 모델로 여러 태스크를 동시에 학습할 수 있는 멀티 태스크 학습 방식을 접목한다. 본 연구에서는 AI-Hub 플랫폼의 피겨 스케이팅 동작 데이터를 활용하였으며, 제안하는 접근법을 검증하기 위해 전체 신체 스켈레톤 그래프와 하반신 스켈레톤 그래프의 예측 성능 및 효율성을 비교하는 실험과 싱글 태스크 학습과 멀티 태스크 학습을 비교하는 실험을 진행하고 정확도를 비교한다. 이를 통해 정확하고 효율적인 피겨 스케이팅 점수 산출 프로그램의 기반을 확보하고자 한다.
본 연구에서는 스켈레톤 그래프 데이터 구조의 내재적인 패턴을 잘 학습하기 위해, 그래프 데이터를 심층적으로 학습할 수 있는 딥러닝 모델인 그래프 신경망(Kipf and Welling, 2017; Scarselli et al., 2008)을 제안 방법론의 주요 backbone 모델로 활용하고자 한다. 특히, 여러 그래프 신경망 모형 중에서 그래프 어텐션 네트워크(Graph Attention Network, GAT) (Veličković et al., 2018)를 적용한다. GAT는 vanilla GNN 모델에 자기주의 메커니즘(self-attention mechanism) (Vaswani et al., 2017)을 접목함으로써, 이웃 노드의 정보를 집계할 때 주의 계수(attention coefficient)를 통해 각 이웃 노드의 중요도를 반영한 합성곱 연산을 진행한다. GAT 합성곱 레이어는 노드의 특징 집합인
σ는 비선형성을 더해주는 함수, Ni는 노드 i의 이웃 집합,
멀티 태스크 학습은 여러 태스크 간의 정보를 공유하여 공통 표현을 학습함으로써, 모델의 일반화 성능을 향상시키는 접근 방식이다. 이를 통해 개별 태스크의 과적합을 방지하고, 학습 효율성을 높일 수 있다. 특히, 한 태스크에서 학습한 지식을 다른 태스크에 활용할 수 있다는 점에서 관련성이 높은 다수의 태스크를 동시에 학습하는 데 강점을 가진다. 또한, 여러 태스크를 단일 모델로 학습함으로써 매개변수의 수를 줄이고 모델의 복잡성을 낮출 수 있다. 이러한 장점들 덕분에 자연어 처리(Collobert and Weston, 2008), 컴퓨터 비전(Girshick, 2015), 의료 데이터 분석(Ramsundar et al., 2015) 등 다양한 분야에서 활발히 적용되고 있다.
딥러닝에서 멀티 태스크 학습의 은닉층(hidden layers) 매개변수 공유 방식은 주로 hard parameter sharing 방식과 soft parameter sharing 방식으로 구분된다(Ruder, 2017; Caruana, 1993). 먼저, 하드 방식은 모든 태스크가 다수의 은닉층을 공유(i.e., 공유 레이어)하고, 각 태스크별로 독립적인 출력층을 가지는 구조(i.e., 태스크 특화 레이어)를 사용한다. 다음으로, 소프트 방식은 각 태스크가 고유한 모델과 매개변수를 가지되, 매개변수 간 거리를 L2-거리 또는 trace 등을 통해 정규화하여 매개변수 간 유사성을 유도하는 방식이다. 두 방식의 구조적 차이는 <Figure 2>에서 확인할 수 있다.
본 연구에서는 동작 분류 모델에 멀티 태스크 학습을 효율적으로 접목시키는 것에 초점을 맞추어, 하드 파라미터 공유 방식을 적용한다. 이는 모든 태스크가 하나의 공유된 모델 구조와 파라미터를 활용하므로, 소프트 방식에 비해 계산 효율성이 높고, 태스크 간 공통된 특징을 효과적으로 학습할 수 있는 장점이 있다.
본 연구에서는 피겨 스케이팅 동작 분류 모델을 학습하기 위해 AI-Hub 플랫폼에서 수집된 피겨 스케이팅 동작 데이터를 활용하였다(AI-Hub, 2024). 이 데이터는 피겨 스케이팅 경기 분석, 교육, 및 훈련 프로그램 개발을 목적으로 한 주요 동작 영상 데이터로 구성되어 있다. 본 데이터는 다양성과 균형을 고려하여 시연자를 선정하여 설계되었다. 또한, 국제빙상경기연맹(ISU)에서 심판이 선수의 수행을 점프, 스핀, 스텝으로 3가지 과제로 나누어 채점하는 기준을 반영하여, 이를 기본 동작 유형으로 6개의 점프, 5개의 스핀, 5개의 스텝으로 총 16가지 동작이 선정되었다. 하나의 동작은 RGB 8채널로 수집되었으며, 평균 촬영 시간은 8초이며, 초당 30프레임의 JPG 파일이 존재한다. 하나의 동작 영상에는 2D 키포인트 정보 8개, 3D 키포인트 정보 1개, 그리고 메타 레이블 데이터 1개가 생성되어 있다. 본 데이터는 피겨 스케이팅 국제 심판 4명으로 구성된 최고 전문위원과 8명의 국내 심판 및 코치의 12명의 전문가에 의하여 데이터의 결과와 레이블을 검수하였다. 이를 통해 본 데이터에 대한 신뢰성을 확보하였다.
본 연구에서는 해당 데이터에서 피겨 스케이팅 동작에 대한 2D 키포인트 정보와 메타 레이블 데이터를 사용하였다. 전체 데이터 중 프레임 수가 200 이상 300 이하인 데이터를 필터링하여 총 14,837개의 데이터를 활용하였다. 피겨 스케이팅 동작 데이터에는 다음과 같은 총 4가지의 분류 태스크가 가능한 형태로 레이블이 존재한다.
동작의 분류(대분류, 소분류) 뿐만 아니라 동작 분류의 정확도에 영향을 줄 수 있는 기술의 성공 여부나 시연자의 숙련도 등이 함께 존재한다. 각 태스크별 데이터 분포는 <Figure 3>에 제시되어 있다. 동작의 대분류(Major)에서는 Jump 클래스가 가장 많은 데이터를 포함하고 있으며, Step 클래스의 데이터가 상대적으로 적다. 기술의 성공 여부(Success)에서는 실패(Failure) 데이터가 성공(Success) 데이터보다 많은 것이 특징이며, 숙련도(Level)에서는 Beginner 수준의 데이터가 가장 많고 Advanced 수준의 데이터가 가장 적다. 전반적으로 대분류, 성공 여부, 숙련도 태스크에서는 심각한 불균형이 나타나지 않지만, 동작의 소분류(Sub)에서는 Camel, Spiral 등의 특정 기술에서 데이터 수가 적어 정보량이 부족한 경향이 있다. 그러나 이 수준의 불균형은 모델의 학습을 저해할 정도로 심각한 수준은 아니라고 판단하였다.
본 연구에서는 피겨 스케이팅 동작 분류를 위한 효율적인 인공지능 모델을 제안한다. 제안하는 방법론은 (1) 피겨 스케이팅 동작 스켈레톤 그래프 데이터 생성, (2) 그래프 신경망 기반 멀티 태스크 학습 모델로 구성되어 있다.
본 연구에서는 고용량의 피겨 스케이팅 동작 영상 데이터를 그대로 사용하는 것이 아닌, 시연자의 관절 움직임에 초점을 맞추어 스켈레톤 그래프로 변환하여 사용하고자 한다. 스켈레톤 그래프는 사람의 관절을 노드(Node)로 사용하며, 이종 방향 그래프(Heterogeneous Directed Graph)로 구성된다. 각 노드는 (x, y) 위치 정보를 변수로 갖는다. 스켈레톤 그래프의 엣지(Edge)는 두 가지로 구분된다. 첫 번째는 공간 특성 엣지(Spatial Edge)로, 서로 다른 두 노드를 연결하며 뼈와 같은 관절 간 물리적 관계를 의미한다. 본 연구에서는 일반적으로 스켈레톤 그래프 생성에서 공간 특성 엣지를 단방향으로 설정하는 것과 달리, 각 관절이 서로 영향을 주고 받는다는 전제하에 양방향으로 방향성을 두었다(Yan et al., 2018). 두 번째는 시간 특성 엣지(Temporal Edge)로, 시간의 흐름에 따라 연속된 동일한 노드를 연결한다. 이는 관절의 움직임과 시간적 변화를 표현한다. 따라서 시간의 흐름에 따라 이전 프레임에서 다음 프레임으로 단방향으로 방향성을 두었다. <Table 1>은 이러한 정의를 수학적으로 나타낸 것이다.
| Components | Mathematical Expression |
|---|---|
| Graph(G) | G = (V, ESpatial, ETemporal) |
| Nodes(V) | where J is the set of joints and T ∈ [200, 300] means the number of frames. The feature of jt is (xjt,yjt), where (xjt,yjt) means the location of the joint jt. |
| Spatial Edges(ESpatial) | where S is the set of physical connections between joints. |
| Temporal Edges(ETemporal) |
본 연구에서는 피겨 스케이팅의 예술성은 상반신에, 기술성은 하반신에서 주로 표현되는 것을 고려하여, 동작 분류 모델의 성능에 상반신 노드 활용의 효용성이 크지 않을 것으로 연구 가설을 설정하였다. 예를 들어, 점프는 스케이트의 토나 날의 사용 방식에 따라 토룹, 플립, 러츠(토 점프), 그리고 룹, 살코, 악셀(엣지 점프)로 나뉜다. 점프의 세부적인 종류는 인사이드 엣지와 아웃사이드 엣지의 사용 방식, 그리고 오른발과 왼발의 역할에 따라 결정된다. 이러한 점에서 하반신에 피겨 스케이팅 기술과 관련된 정보가 집중되어 있음을 알 수 있다. 따라서 시연자의 신체 전체를 고려하는 그래프(i.e., All Node Graph, Gall)가 아닌, 하반신 노드 그래프(i.e., Lower Node Graph, Glower)를 인풋 데이터로 활용하고자 하였다. 하반신 노드 그래프와 전체 노드 그래프의 관절 집합과 관절 사이의 물리적 관계 집합은 <Table 2>에 표현되어 있다.
| J | S | |
|---|---|---|
| Glower | ‘Hip’, ‘RHip’, ‘LHip’, ‘LKnee’, ‘LAnkle’, ‘LHeel’, ‘LBigToe’, ‘LSmallToe’, ‘RKnee’, ‘RAnkle’, ‘RHeel’, ‘RBigToe’, ‘RSmallToe’ | (‘Hip’, ‘LHip’), (‘Hip’, ‘RHip’), (‘LHip’, ‘LKnee’), (‘LKnee’, ‘LAnkle’), (‘LAnkle’, ‘LHeel’), (‘LHeel’, ‘LSmallToe’), (‘LHeel’, ‘LBigToe’), (‘RHip’, ‘RKnee’), (‘RKnee’, ‘RAnkle’), (‘RAnkle’, ‘RHeel’), (‘RHeel’, ‘RSmallToe’), (‘RHeel’, ‘RBigToe’) |
| Gall | ‘Head’, ‘Neck’, ‘LShoulder’, ‘LElbow’, ‘LWrist’, ‘RShoulder’, ‘RElbow’, ‘RWrist’, ‘Hip’, ‘RHip’, ‘LHip’, ‘LKnee’, ‘LAnkle’, ‘LHeel’, ‘LBigToe’,’LSmallToe’, ‘RKnee’, ‘RAnkle’, ‘RHeel’, ‘RBigToe’, ‘RSmallToe’ | (‘Head’, ‘Neck’), (‘Neck’, ‘LShoulder’), (‘Neck’, ‘RShoulder’), (‘LShoulder’, ‘LElbow’), (‘LElbow’, ‘LWrist’), (‘RShoulder’, ‘RElbow’), (‘RElbow’, ‘RWrist’), (‘Neck’, ‘Hip’), (‘Hip’, ‘LHip’), (‘Hip’, ‘RHip’), (‘LHip’, ‘LKnee’), (‘LKnee’, ‘LAnkle’), (‘LAnkle’, ‘LHeel’), (‘LHeel’, ‘LSmallToe’), (‘LHeel’, ‘LBigToe’), (‘RHip’, ‘RKnee’), (‘RKnee’, ‘RAnkle’), (‘RAnkle’, ‘RHeel’), (‘RHeel’, ‘RSmallToe’), (‘RHeel’, ‘RBigToe’) |
Gall과 Glower의 그래프 생성 구조는 <Figure 4>에 나타나 있다. <Figure 4>에서 점은 노드를 의미하며, 양방향 엣지는 공간 특성 엣지를, 단방향 엣지는 시간 특성 엣지를 의미한다. 또한, Gall과 Glower의 데이터 구조 특성에 대한 비교 결과는 <Table 3>에 제시되어 있다. <Table 3>은 Glower와 Gall의 노드 개수, 공간 특성 엣지 개수, 시간 특성 엣지 개수를 단일 프레임과 전체 프레임의 수가 t일 때를 각각 비교한 것이다. <Figure 4>와 <Table 3>을 살펴보면, Glower의 경우는 Gall에 비해 약 60%의 데이터만을 활용하는 것을 확인할 수 있다.
| Component | Gall | Glower | Ratio (%) | |
|---|---|---|---|---|
| Single frame | # of Nodes | 21 | 13 | 61.9 |
| # of Spatial Edges | 20 | 12 | 60.0 | |
| t frames | # of Nodes | 21t | 13t | 61.9 |
| # of Spatial Edges | 20t | 12t | 60.0 | |
| # of Temporal Edges | 21(t - 1) | 13(t - 1) | 61.9 |
본 연구에서 제안하는 최종적인 그래프 신경망 기반 멀티 태스크 학습 기반 피겨 스케이팅 동작 분류 모델의 구조는 <Figure 5>에 도식화되어 있다.
<Figure 5(c)>를 살펴보면, 전체적인 모델 구조는 두 개의 GAT block들과 글로벌 평균 풀링 층, 각 태스크 분류를 위한 fully connected (FC) block들로 구성된다. 이때, GAT block과 글로벌 평균 풀링 층의 경우 공유 레이어로 설정하여 모든 태스크가 공통된 피겨 스케이팅 동작 특징을 학습할 수 있도록 하였으며, FC block의 경우 태스크 특화 레이어로 설정하여 각 태스크별로 최적화된 표현을 학습하도록 구성하였다. 각 block에 대한 세부 도식은 <Figure 5(a)>와 <Figure 5(b)>에 나타나 있으며, 상세 설명은 다음과 같다.
우선, GAT block은 피겨 스케이팅 동작 그래프의 공간적, 시간적 관계를 모델링하는 역할을 수행하며, temporal block과 spatial block으로 구성된다. 스켈레톤 그래프의 경우, 공간 특성 엣지로 연결된 노드의 최대 거리는 전체 노드 그래프에서 11, 하반신 노드 그래프에서 10에 불과하다. 반면, 시간 특성 엣지로 연결된 노드 간의 최대 거리는 T-1이며, T는 프레임의 수로 본 연구에서는 200 이상 300 이하의 값을 갖는다. 이로 인해, 동일한 개수의 레이어를 공간 특성과 시간 특성 엣지에 적용하면, 공간 특성 엣지가 과도하게 반영되거나, 시간 특성 엣지의 반영이 미약해질 수 있다. 이를 방지하기 위해, 본 연구에서는 시간 특성 엣지를 반영하는 temporal block에서 GAT 컨볼루션 레이어를 9개, 공간 특성 엣지를 반영하는 spatial block에서는 GAT 컨볼루션 레이어를 1개로 설정하여 시간적 특성이 깊이 학습될 수 있도록 설계하였다. GAT block의 출력은 3번째, 6번째, 9번째 시간 레이어의 결과와 공간 레이어의 결과를 concat하여 생성된다. 따라서, 입력 데이터 X의 특징 차원이 d라면, 출력 데이터 x의 특징 차원은 4d가 된다.
이후, 글로벌 평균 풀링(global average pooling) 층을 통해 노드별 정보를 통합하여 그래프 전체의 전역적 표현을 추출한다. 글로벌 평균 풀링은 모든 노드의 변수의 평균을 계산하여 이를 그래프의 전역적 표현으로 사용하며, 동작의 전체적인 특성을 효과적으로 요약하고 네트워크의 복잡도를 줄여 학습 안정성을 높이는 효과를 기대할 수 있다. 해당 층의 출력은 각 태스크별 FC block의 입력으로 사용된다.
마지막으로, FC block을 통해 각 태스크별로 특화된 표현을 학습한다. 본 연구에서는 네 가지 태스크(대분류, 소분류, 동작 성공 여부, 시연자의 숙련도)별로 label의 개수에 차이가 존재하여, FC block의 구조를 태스크별로 다르게 설계 후 서로 다른 출력을 생성하였다. 이때, 각 태스크 별로 FC block의 은닉층의 출력 크기를 조절하여 태스크별 학습을 최적화하였다. FC block의 태스크별 은닉층 출력 크기는 <Table 4>에 제시되어 있다.
| Major | Sub | Success | Level | |
|---|---|---|---|---|
| 1st FC Layer | 16 | 64 | 16 | 16 |
| 2nd FC Layer | 8 | 32 | 8 | 8 |
| 3rd FC Layer | 3 | 16 | 2 | 3 |
본 연구는 하반신 노드 그래프를 활용하는 것과 멀티 태스크 모델을 사용하는 것이 피겨 스케이팅의 4가지 태스크를 분류하는 데 있어 우수한 성능과 효율성을 동시에 제공한다는 점을 입증하고자 한다. 이를 위해 총 3가지 실험을 설계하고 진행하였다.
이들 실험을 비교함으로써 다양한 관점을 평가할 수 있다. 하반신 멀티 모델과 하반신 싱글 모델(실험 1과 실험 2)을 비교하여 멀티 태스크 학습의 효율성을 확인할 수 있다. 또한, 하반신 멀티 모델과 전체 멀티 모델(실험 1과 실험 3)를 비교하여 하반신 노드 그래프의 효율성을 평가할 수 있다. 이러한 실험 결과를 통해 하반신 노드 그래프를 활용하고 멀티 태스크 모델을 채택하는 것이 피겨 스케이팅의 4가지 태스크를 분류하는 데 있어 성능과 효율성 모두에서 탁월한 접근 방식임을 입증할 수 있을 것이다.
본 연구에서는 실험 결과를 공정하게 비교하기 위해 전체 데이터를 훈련, 검증, 테스트 셋으로 분리하는 hold-out 검증 방식을 채택하였다. 데이터는 7:2:1 비율로 분할하여 최종적으로 훈련 데이터셋 10,387개, 검증 데이터셋 2,967개, 테스트 데이터셋 1,438개로 구성하였다. 모델 최적화를 위해 Adam optimizer를 사용하였으며, 모델의 하이퍼파라미터인 epoch 수, learning rate, weight decay, batch size는 각각 55000, 1e-3, 5e-4, 200으로 고정하여 실험을 진행하였다. 학습에 사용된 손실 함수로는 다중 분류 작업에 널리 사용되는 cross entropy loss를 사용하였다. 구체적으로는 네 가지의 태스크 각각의 손실 함수를 cross entropy loss로 사용하였으며, 최종 손실함수를 이들의 합으로 계산하였다. 관련 수식은 아래에 제시되어 있다.
또한, 제안 모델과의 성능 비교를 위해 두 가지 베이스라인 모델을 설계하였다.
본 실험에서는 FC block은 모두 동일하게 고정하고, GAT block 내의 GAT layer만을 각각 GCN layer 및 GraphSAGE layer로 교체하여 성능을 평가하였다. 특히 GraphSAGE의 aggregation 방식은 spatial block과 temporal bock 양쪽 모두에서 평균 연산을 사용하도록 설정하였다. 본 연구는 Intel(R) Xeon(R) Gold 6444Y Processor, NVIDIA RTX A6000 48GB, Python 3.10.14, CUDA version 12.4, PyTorch 2.4.0, torch-geometric 2.5.3 환경에서 수행되었다.
본 연구는 피겨 스케이팅 데이터를 기반으로 하반신 멀티 모델이 대분류, 소분류, 기술의 성공 여부, 시연자의 숙련도라는 4가지 태스크를 효율적으로 분류할 수 있음을 검증하기 위해 하반신 멀티 모델을 하반신 싱글 모델 및 전체 멀티 모델과 비교하였다. 특히, 본 연구는 모델의 성능을 단순히 정확성 관점에서만 평가하는 것이 아니라, 코드 실행 시간을 비교 분석하여 하반신 노드 그래프와 멀티 태스크 학습의 효율성을 입증하고자 하였다. 이를 통해 하반신 노드 그래프와 멀티 태스크 학습의 효율성을 실증적으로 입증하고자 하였다. 이때, 모델의 분류 성능 평가를 위해 정확도(Accuracy), F1-score, Area Under Curve (AUC)를 주요 성능 지표로 설정하고, 코드 실행 시간을 효율성 지표로 활용하여 실험을 수행하였다. 추가적으로 본 연구에서 사용된 GAT의 유효성을 평가하기 위하여, 본 모델에서 GAT 컨볼루션 레이어를 GCN이나 GraphSAGE 컨볼루션 레이어로 대체한 모델들과의 비교 실험도 진행하였다. 마지막으로, case study를 통해 하반신 데이터만을 활용하는 것이 전체 데이터를 사용하는 것보다 효율적임을 시각적으로 입증하였다.
아래 <Figure 6>은 검증 데이터 셋에서의 epoch별, 태스크별 loss 평균을 비교한 그래프이다.
<Figure 6>을 살펴보면, 하반신 멀티 모델이(빨간색)이 가장 우수한 성능을 보였다. 학습 초기에는 모든 모델이 유사한 높은 loss 값에서 시작하였으며, epoch가 진행됨에 따라 그 차이를 보였다. 하반신 멀티 모델 최종적으로 가장 낮은 loss 값에 수렴하였다. 반면, 전체 멀티 모델(초록색)은 상대적으로 높은 loss를 유지하였고, 하반신 싱글 모델(파란색)은 중간 수준의 성능을 보였다.
이 결과는 하반신 데이터만을 사용한 멀티 태스크 학습을 통해 전체 신체 데이터를 사용하거나 싱글 태스크 학습을 사용하는 모델보다 더 효율적인 학습이 가능함을 시사한다. 특히 하반신 중심의 멀티 태스크 접근법의 안정적인 수렴과 낮은 최종 loss 값은 해당 접근법이 피겨 스케이팅 동작 분석에 효과적임을 보여준다.
<Table 5>는 테스트 데이터 셋에서의 전체 노드 그래프를 이용한 멀티 태스크 학습, 하반신 노드 그래프를 이용한 멀티 태스크 학습, 하반신 노드 그래프를 이용한 싱글 태스크 학습의 가장 성능이 좋은 모델에서의 loss와 정확도를 비교한 것이다. 모델은 cross entropy loss를 기준으로 선정하였으며, 멀티 태스크 학습의 경우에는 대분류의 cross entropy loss를 기준으로 선정하였다.
| Experiment | Label | Loss | Accuracy (%) | F1-score (%) | AUC (%) | |
|---|---|---|---|---|---|---|
| GAT | MTL for Glower | Major | 0.1320 | 95.08 | 94.89 | 99.44 |
| Sub | 1.0906 | 56.78 | 59.05 | 95.88 | ||
| Success | 0.5991 | 65.07 | 64.17 | 72.03 | ||
| Level | 1.0563 | 42.55 | 32.20 | 59.78 | ||
| STL for Glower | Major | 0.2694 | 90.22 | 89.70 | 97.77 | |
| Sub | 1.2665 | 49.63 | 51.02 | 94.33 | ||
| Success | 0.6662 | 59.00 | 53.86 | 59.41 | ||
| Level | 1.0838 | 38.50 | 18.53 | 50.00 | ||
| MTL for Gall | Major | 0.1833 | 92.92 | 92.88 | 98.98 | |
| Sub | 1.2182 | 52.33 | 53.56 | 94.61 | ||
| Success | 0.6125 | 64.80 | 64.70 | 70.78 | ||
| Level | 1.0715 | 39.92 | 30.31 | 57.52 | ||
하반신 멀티 모델은 하반신 싱글 모델과 전체 멀티 모델에 비하여 모든 태스크에 대한 평균 각각 약 0.1020, 약 0.0519 더 좋은 loss 성능을 보여주었다. 또한, 하반신 멀티 모델은 다른 모델들과 비교했을 때 정확도 면에서 뛰어난 성능을 보였다. 하반신 싱글 모델에 비하여 대분류에서 4.86%p, 소분류에서 7.15%p, 기술의 성공 여부에서 6.07%p, 시연자의 숙련도에서 4.05%p 더 높은 정확도를 보였다. 전체 멀티 모델과 비교했을 때도 대분류에서는 2.16%p, 소분류에서는 4.45%p, 기술의 성공 여부에서는 0.27%p, 시연자의 숙련도에서는 2.63%p 더 높은 정확도를 기록하였다. 더불어, F1-Score의 경우 기술의 성공 여부 태스크에서만 전체 멀티 모델(64.70%)과 약 0.53%p 차이로 근소하게 낮았으나, 그 외 모든 태스크에서 가장 우수한 성능을 달성했다. 특히 AUC 지표는 모든 태스크에서 가장 높은 성능을 보였다. 따라서, 하반신 멀티 모델이 loss, 정확도, F1-score, AUC의 모든 영역에서 전반적으로 우수한 성능을 제공함을 입증하였다.
본 연구에서는 제안하는 모델에서 GAT의 효용성을 검증하기 위하여 추가적으로 MTL for Glower의 실험에서의 GCN과 GraphSAGE 모델과 비교를 함께 수행하였다. <Table 6>은 그 결과이다.
| Experiment | Label | Loss | Accuracy (%) | F1-Score (%) | AUC (%) |
|---|---|---|---|---|---|
| GAT | Major | 0.1320 | 95.08 | 94.89 | 99.44 |
| Sub | 1.0906 | 56.78 | 59.05 | 95.88 | |
| Success | 0.5991 | 65.07 | 64.17 | 72.03 | |
| Level | 1.0563 | 42.55 | 32.20 | 59.78 | |
| GCN | Major | 0.4740 | 81.05 | 78.67 | 92.52 |
| Sub | 1.7914 | 34.86 | 29.02 | 86.59 | |
| Success | 0.6675 | 58.93 | 54.48 | 60.82 | |
| Level | 1.0740 | 41.00 | 31.26 | 56.33 | |
| GraphSAGE | Major | 0.6750 | 70.94 | 69.20 | 86.51 |
| Sub | 2.0253 | 31.02 | 24.87 | 81.73 | |
| Success | 0.6559 | 61.56 | 57.80 | 62.91 | |
| Level | 1.0738 | 42.08 | 31.43 | 55.82 |
모든 평가 지표에서 GAT 모델이 가장 우수한 성능을 나타내었다. 특히 대분류 태스크에서 GAT는 GCN 대비 약 14.03%p, GraphSAGE 대비 약 24.14%p 높은 정확도, GCN 대비 약 16.22%p, GraphSAGE 대비 약 25.69%p 높은 F1-score, GCN 대비 약 6.92%p, GraphSAGE 대비 약 12.93%p 높은 AUC를 달성하며 가장 큰 성능 차이를 보였다. 그 외 모든 태스크의 모든 지표에 대해 GAT가 가장 우수한 성능을 달성하였으며, loss 측면에서도 GAT가 모든 태스크에서 가장 낮은 값을 기록하여 모델의 안정성을 입증하였다.
본 연구에서는 하반신 멀티 모델이 계산 효율성이 더 높다는 것을 입증하기 위해, 각 실험의 태스크별 코드 실행 시간을 비교하였다. 이는 <Table 7>에 기재되어 있다.
| Task | Gall | Glower | |
|---|---|---|---|
| MTL | MTL | STL | |
| Graph Generalization | 1353 | 862 | |
| Converting Graph to Pytorch Geometric | 1136 | 664 | |
| Model Training | 39095 | 24236 | 92613 |
| Inference | 0.73 | 0.45 | 1.90 |
| Task | Ratio (L/A) (%) | Ratio (M/S) (%) | |
| Graph Generalization | 63.71 | - | |
| Converting Graph to Pytorch Geometric | 58.45 | - | |
| Model Training | 61.99 | 26.17 | |
| Inference | 61.64 | 23.68 | |
동일한 멀티 태스크 학습 모델에서 하반신 멀티 모델을 사용한 경우, 전체 멀티 모델 대비 그래프 생성 시간은 63.71%, Pytorch Geometric으로 변환하는 시간은 58.45%, 모델 훈련 시간은 61.99%, 테스트 데이터에 대한 추론 시간은 61.64% 수준에 그쳤다. 또한, 하반신 싱글 모델은 각 태스크마다 개별 모델을 훈련해야 하므로 전체 실행 시간이 92,613초로 측정되었다. 반면, 하반신 멀티 모델은 4개의 태스크를 동시에 훈련하여 실행 시간이 24,236초로 단축되었으며, 이는 하반신 싱글 모델 대비 약 3.82배 더 효율적이다. 심지어 새로운 데이터에 대한 추론 시간은 하반신 멀티 모델이 하반신 싱글 모델보다 약 4.22배 더 효율적이다. 즉, 하반신 멀티 모델을 사용 하는 것이 실시간 사용 측면에서도 매우 효율적임을 시사한다. 따라서, 하반신 노드 그래프를 활용하는 것과 멀티 태스크 학습 모델을 채택하는 것은 시간 복잡도 측면에서 매우 효율적인 접근 방식이다.
하반신 데이터만을 사용하는 것이 전체 데이터를 사용하는 것보다 효율적임을 시각적으로 검증하기 위해 추가적인 case study를 수행하였다. 분석 대상 케이스는 다음 기준에 따라 선정하였다:
시각화는 20 frame 단위로 샘플링하고, Temporal Edge는 제외하여 Spatial Edge만을 표시하여 명확성을 확보하였다.
<Figure 7>의 결과를 살펴보면, 동일한 레이블을 가진 서로 다른 두 케이스에서 하반신 동작 패턴(<Figure 7> (c), (d))이 유사할 때, 전체 신체 동작 패턴(<Figure 7> (a), (b)) 또한 매우 흡사한 것을 확인할 수 있다. 이는 하반신 데이터만으로도 동작의 핵심적인 특징을 충분히 포착 가능하며, 상반신 데이터가 동작 분류, 성공 여부 판단, 시연자의 숙련도 판단 등의 태스크에 미치는 영향이 미미함을 시사한다.
본 연구에서는 피겨 스케이팅 동작 분류를 위한 효율적인 인공지능 모델을 제안하였으며, 그래프 구조를 활용하여 데이터의 내부적 관계를 효과적으로 모델링하는 접근법을 탐색하였다. 특히, 피겨 스케이팅 기술의 핵심이 되는 하반신 관절 데이터를 중심으로 분석하여 전체 신체 관절을 활용하는 기존 방식 대비 효율성을 높였다. 또한, 단일 태스크 학습이 아닌 멀티 태스크 학습 방식을 도입하여 기술의 대분류 및 소분류, 성공 여부, 시연자의 숙련도를 하나의 모델에서 동시에 분류하도록 설계하였다. 피겨 스케이팅 동작 데이터를 활용하여 제안한 접근법을 검증한 결과, 하반신 스켈레톤 그래프를 이용한 모델이 전체 신체 스켈레톤 그래프 기반 모델과 비교하여 높은 효율성을 보였으며, 멀티 태스크 학습 방식이 싱글 태스크 학습 방식 대비 정확도와 학습 효율성 측면에서 우수한 성능을 나타냈다.
본 연구의 주요 기여점은 다음과 같다. 첫째, 데이터 효율성이다. 본 연구에서는 하반신 노드 그래프를 활용하여 전체 노드 그래프의 약 60%에 해당하는 데이터만으로 효율성을 확보하였다. 이는 데이터 저장 공간 뿐만 아니라 그래프 데이터 생성, 모델 훈련 시간에서도 약 60%의 시간만 소요되어, 시간 복잡도 측면에서도 매우 효율적임을 입증하였다. 더불어, case study를 통해 하반신 데이터만으로도 동작의 핵심 특징을 충분히 포착할 수 있음을 시각적으로 검증하였다. 둘째, 태스크 효율성이다. 본 연구는 대분류, 소분류, 기술의 성공 여부, 시연자의 숙련도라는 4가지 태스크를 분류하였다. 기존의 싱글 태스크 학습 방식으로는 각 태스크마다 별도의 모델을 생성하고 훈련해야 하므로 총 4개의 모델이 필요하다. 그러나, 본 연구에서는 멀티 태스크 학습을 적용하여 단 하나의 모델로 4가지 태스크를 동시에 학습하였고, 이를 통해 모델 훈련 시간을 약 3.82배 단축시켰다. 셋째, 우수한 성능이다. 제안된 하반신 멀티 모델은 4가지 모든 태스크에 대해 전체 멀티 모델에 비해 평균 약 3.31%p, 하반신 싱글 모델에 비해 평균 약 6.96%p 우수한 정확도를 보였다. 이는 하반신 노드 그래프가 피겨 스케이팅 동작과 관련된 중요한 정보를 대부분 포함하고 있으며, 태스크 간 높은 연관성을 통해 공유 표현을 학습하는 멀티 태스크 학습 방식이 긍정적인 효과를 보여주었기 때문으로 해석 가능하다. 또한, 본 모델에서 적용한 GAT의 효과성을 검증하기 위해, GAT를 GCN 및 GraphSAGE와 비교한 추가 실험을 수행하였다. 그 결과, GAT 기반 모델이 모든 베이스라인 모델을 상회하는 성능을 보였으며, 이는 어텐션 메커니즘이 피겨 스케이팅 동작의 복잡한 관절간 관계를 효과적으로 모델링하는데 기여함을 시사한다.
본 연구는 그래프 기반 피겨 스케이팅 동작 분석의 효율성을 높이는 방향으로 설계되었으며, 실험 결과에서도 제안한 방법론이 높은 성능을 보였다. 하지만 몇 가지 보완이 필요한 한계점이 존재한다. 첫째로, 본 연구에서는 AI-Hub 플랫폼에서 제공하는 피겨 스케이팅 동작 데이터를 활용하였지만, 해당 데이터셋이 특정 환경에서 수집된 자료로 구성되어 있어 다양한 조건에서의 일반화 성능 검증이 충분히 이루어지지 않았다. 둘째로, 연구에서 도입한 멀티 태스크 학습 방식은 기술의 대분류, 소분류, 성공 여부, 시연자의 숙련도를 동시에 학습하는 방식으로 설계되어 기술의 대분류 및 소분류 분류에서 우수한 성능을 확보하였으나, 동작 성공 여부와 숙련도 예측 성능은 상대적으로 낮은 경향을 보였다. 이는 동작 성공 여부가 착지 정확도 등 다양한 요인이 복합적으로 영향을 미치기 때문에, 현재 디자인된 스켈레톤 그래프 데이터만으로는 완벽한 예측이 어려울 수 있음을 의미한다. 또한, 숙련도의 경우 이를 정량적으로 평가하는 기준이 명확하지 않기 때문에, 데이터 라벨링 과정에서 주관적인 요소가 개입되었을 가능성이 있다. 셋째로, 연구에서 제안한 모델은 기존 데이터셋을 활용하여 실험을 진행하였지만, 실제 경기 환경에서의 적용 가능성은 검증되지 않은 부분이 있다.
이와 같은 한계는 연구의 근본적 제약이라기보다는 향후 발전을 위한 보완 과제로 해석할 수 있다. 첫째로, 향후 연구에서는 다양한 연령대와 숙련도를 가진 스케이터, 다양한 환경에서 수집된 데이터의 체계적인 구축이 선행된다면 확장된 실험이 가능할 것으로 사료된다. 둘째로, 모델 학습 구조와 관련하여 성능과 효율 간의 균형을 보다 정밀하게 검토하기 위해 소프트 파라미터 공유 방식을 포함한 다양한 멀티 태스크 학습 구조에 대한 탐색을 함께 수행하고자 한다. 이와 더불어, 최신 동적 그래프 신경망과의 비교 실험을 추가하여 제안된 모델의 효과성을 체계적으로 입증할 계획이다. 셋째로, 숙련도와 같은 주관적 요인이 개입될 수 있는 라벨에 대해서는 정량적이고 객관적인 기준을 마련함으로써 모델 학습의 신뢰성을 높이고자 한다. 마지막으로, 본 연구의 결과를 기반으로 실효성 있는 피겨 스케이팅의 객관적인 점수 예측이 가능한 시스템의 개발이 추가적으로 필요하다. 본 연구는 피겨 스케이팅 기술을 대분류와 소분류로 체계화하고, 기술의 성공 여부 및 시연자의 숙련도를 분류하는 작업을 진행하였다. 그러나 이는 피겨 스케이팅 종목의 점수로 직접적인 사용이 어려우므로, 점수 예측 모델을 본 연구와 통합하여 피겨 스케이팅 종목의 채점 과정에서 편향과 오류를 최소화하고 보다 공정한 평가를 제공할 수 있을 것이다. 따라서, 향후 연구에서는 실제 경기 환경에서 실시간 평가가 가능한 모델로 확장하는 방안이 필요할 것으로 보인다.
The work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korea government (MSIT) (No. RS-2023-00242528, No. RS-2023-00245529) and by the MSIT(Ministry of Science and ICT), Korea, under the ITRC(Information Technology Research Center) support program (IITP-2025-RS-2024-00437756) supervised by the IITP(Institute for Information & Communications Technology Planning & Evaluation).
| 1. | AI-Hub, Figure skating action dataset, https://aihub.or.kr, accessed [2024-01-24]. |
| 2. | Bai, X. (2023), Tracking and Decomposition of Throwing and Jumping Movements in High Level Figure Skating Based on Deep Learning, International Journal of Information and Communication Technology, 22(3), 240-253.![]() |
| 3. | Caruana, R. (1993), Multitask Learning: A Knowledge-Based Source of Inductive Bias, Proc. 10th Int. Conf. on Machine Learning (ICML), 41-48.![]() |
| 4. | Collobert, R. and Weston, J. (2008), A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning, Proc. 25th Int. Conf. on Machine Learning (ICML), 160-167.![]() |
| 5. | Du, Y., Wang, W., and Wang, L. (2015), Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition, Proc. IEEE Int. Conf. on Computer Vision and Pattern Recognition (CVPR), 1110-1118.![]() |
| 6. | Feng, J. (2023), Designing an Artificial Intelligence-Based Sport Management System Using Big Data, Soft Computing, 27(21), 16331-16352.![]() |
| 7. | Girshick, R. (2015), Fast R-CNN, Proc. IEEE Int. Conf. on Computer Vision (ICCV).![]() |
| 8. | Hamilton, W., Ying, Z., and Leskovec, J. (2017), Inductive Representation Learning on Large Graphs, Advances in Neural Information Processing Systems (NeurIPS), 30. |
| 9. | International Olympic Committee, Olympic Games Official Website, https://olympics.com, accessed [2025-08-20]. |
| 10. | Kim, T. S. and Reiter, A. (2017), Interpretable 3D Human Action Analysis with Temporal Convolutional Networks, Proc. IEEE Int. Conf. on Computer Vision and Pattern Recognition Workshops (CVPR Workshops), 20-28.![]() |
| 11. | Kipf, T. N. and Welling, M. (2017), Semi-Supervised Classification with Graph Convolutional Networks, Proc. Int. Conf. on Learning Representations (ICLR). |
| 12. | Koga, A., Bai, X., Jia, Y., and Liu, J. (2025), Lower Limb Biomechanical Differences Between Jumps with Different Number of Rotations in Youth Figure Skaters, Frontiers in Bioengineering and Biotechnology, 13, 1606817.![]() |
| 13. | Kwon, K. H. and Lee, H. B. (2015), Recognition of Basic Motions for Figure Skating Using AHRS, Journal of the Korea Society of Computer and Information, 20(3), 89-96.![]() |
| 14. | Lee, T. K., Lee, H. J., Eun, C. J., and Yang, H. W. (2016), Analysis of Judges’ Judging in Figure Skating, Korean Journal of Sport Science, 27(4), 756-769.![]() |
| 15. | Li, C., Zhong, Q., Xie, D., and Pu, S. (2017), Skeleton-Based Action Recognition with Convolutional Neural Networks, Proc. IEEE Int. Conf. on Multimedia and Expo Workshops (ICMEW), 597-600.![]() |
| 16. | Li, H. and Cao, L. (2024), Analysis and Simulation of Human Dynamics in Figure Skating Sports, Journal of Mechanics in Medicine and Biology, 24(8), 2440054.![]() |
| 17. | Mataruna-Dos-Santos, L. J., Faccia, A., Helú, H. M., and Khan, M. S. (2020), Big Data Analyses and New Technology Applications in Sport Management: An Overview, Proc. Int. Conf. on Big Data in Management (ICBDM), 17-22.![]() |
| 18. | Myung, W., Su, N., Xue, J. H., and Wang, G. (2024), DeGCN: Deformable Graph Convolutional Networks for Skeleton-Based Action Recognition, IEEE Transactions on Image Processing, 33, 2477-2490.![]() |
| 19. | Ofli, F., Chaudhry, R., Kurillo, G., Vidal, R., and Bajcsy, R. (2014), Sequence of the Most Informative Joints (SMIJ): A New Representation for Human Skeletal Action Recognition, Journal of Visual Communication and Image Representation, 25(1), 24-38.![]() |
| 20. | Ramsundar, B., Kearnes, S., Riley, P., Webster, D., Konerding, D., and Pande, V. (2015), Massively Multitask Networks for Drug Discovery, arXiv Preprint, arXiv:1502.02072. |
| 21. | Ruder, S. (2017), An Overview of Multi-Task Learning in Deep Neural Networks, arXiv Preprint, arXiv:1706.05098. |
| 22. | Scarselli, F., Gori, M., Tsoi, A. C., Hagenbuchner, M., and Monfardini, G. (2008), The Graph Neural Network Model, IEEE Transactions on Neural Networks, 20(1), 61-80.![]() |
| 23. | Tanaka, R., Suzuki, T., Takeda, K., and Fujii, K. (2023), Automatic Edge Error Judgment in Figure Skating Using 3D Pose Estimation from a Monocular Camera and IMUs, Proc. 6th Int. Workshop on Multimedia Content Analysis in Sports, 41-48.![]() |
| 24. | Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., and Polosukhin, I. (2017), Attention is All You Need, Proc. Advances in Neural Information Processing Systems (NeurIPS), 30. |
| 25. | Veličković, P., Cucurull, G., Casanova, A., Romero, A., Lio, P., and Bengio, Y. (2018), Graph Attention Networks, Proc. Int. Conf. on Learning Representations (ICLR). |
| 26. | Vemulapalli, R., Arrate, F., and Chellappa, R. (2014), Human Action Recognition by Representing 3D Skeletons as Points in a Lie Group, Proc. IEEE Int. Conf. on Computer Vision and Pattern Recognition (CVPR), 588-595.![]() |
| 27. | Xu, C., Fu, Y., Zhang, B., Chen, Z., Jiang, Y. G., and Xue, X. (2019), Learning to Score Figure Skating Sport Videos, IEEE Transactions on Circuits and Systems for Video Technology, 30(12), 4578-4590.![]() |
| 28. | Yan, S., Xiong, Y., and Lin, D. (2018), Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition, Proc. 32nd Int. Conf. on Artificial Intelligence (AAAI).![]() |
| 29. | Zhang, P., Lan, C., Xing, J., Zeng, W., Xue, J., and Zheng, N. (2017), View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skeleton Data, Proc. IEEE Int. Conf. on Computer Vision (ICCV), 2136-2145.![]() |
이다인 : 부산대학교 수학과와 빅데이터 연계전공 학사를 2023년에 취득하고, 경북대학교에서 데이터사이언스대학원 석사과정에 재학 중이다. 연구분야는 Applied AI, Machine Learning with Graph이다.
김수현 : 부산대학교 대기환경과학과와 통계학과에서 2018년 학사, 울산과학기술원(UNIST) 융합경영대학원 비즈니스 분석에서 2020년 석사, 울산과학기술원(UNIST) 산업공학과에서 2023년 박사 학위를 취득하였다. 서울대학교 기술경영경제정책전공에서 박사 후 연구원을 역임하였으며, 2023년부터 경북대학교 데이터사이언스대학원 교수로 재직하고 있다. 연구 분야는 Applied AI, Machine Learning with Graph이다.
Copyright ยฉ The Korean Institute of Industrial Engineers. All rights reserved.
# 2006, Jungang Royal,13 Seoun-ro, Seocho-gu, Seoul, Republic of Korea (06732)
Tel: +82-2-523-3096 | Fax: +82-2-523-3090 | E-mail: journal@kiie.org