Journal Search Engine

ISSN : 1229-3431(Print)
ISSN : 2287-3341(Online)

Journal of the Korean Society of Marine Environment and Safety Vol.31 No.6 pp.1012-1021
DOI : https://doi.org/10.7837/kosomes.2025.31.6.1012

LLM-Based Classification of Marine Casualty Causes via Verdicts

Soyeong Lee^*, Chang-Hee Lee^**, Dae-Deuk Jeong^***, Ik-Hyun Youn^****†

^*Researcher, MASS Remote Operation Simulation Center, Mokpo National Maritime University, Mokpo 58628, Korea
^**Professor, Division of Maritime Transportation, Mokpo National Maritime University, Mokpo 58628, Korea
^***Professor, Division of Navigation Science, Mokpo National Maritime University, Mokpo 58628, Korea
^****Professor, Division of Navigation & Information Systems, Mokpo National Maritime University, Mokpo 58628, Korea

* First Author : sylee@mmu.ac.kr, 061-240-7283

^† Corresponding Author : iyoun@mmu.ac.kr, 061-240-7283

Received December 5, 2025 Review December 17, 2025 Accepted December 26, 2025

Abstract

This study aimed to establish a data-driven classification system for marine casualty causes by analyzing unstructured text data from the verdicts of the Korea Maritime Safety Tribunal. Accordingly, a phased approach leveraging the context-based causal inference capabilities of large language models (LLMs) was adopted. The analysis utilized the verdicts of safety accidents that occurred between 2020 and 2024. Through detailed cause extraction and vector-based statistical clustering, a five-category classification system was derived: personnel, supervision and teamwork, equipment, organizational, and environmental factors. The reclassification results using the proposed system revealed that causes previously concentrated (over 94%) in a few categories, such as “operating negligence” and “miscellaneous,” were subdivided into “personnel factors (40.6%),” “supervision and teamwork factors (25.3%),” and “equipment factors (23.2%)” based on accountability and systemic perspectives. Furthermore, previously unidentified factors, such as miscommunication and working environments, were distinguished as “organizational” and “environmental” factors. These findings multidimensionally identify accident causes in terms of both accountability and systemic levels, and are expected to serve as vital foundational data for establishing effective, customized prevention measures.

Key Words : Large Language Model (LLM) , Marine Tribunal Verdicts , Marine Accident Statistics , Marine Accident Cause Analysis , Marine Accident Cause Classification

LLM 기반의 해양 안전사고 재결서 분석을 통한 원인 분류 체계 구축

이소영^*, 이창희^**, 정대득^***, 윤익현^****†

^*국립목포해양대학교 자율운항선박 원격운항시뮬레이션센터 연구원
^**국립목포해양대학교 해상운송학부 교수
^***국립목포해양대학교 항해학부 교수
^****국립목포해양대학교 항해정보시스템학부 교수

초록

본 연구는 중앙해양안전심판원의 해양사고 중 안전사고에 대한 재결서 내 비정형 텍스트 데이터를 분석하여, 데이터 기반의 새로운 원인 분류 체계를 구축하는 것을 목적으로 한다. 이를 위해 거대 언어 모델(Large Language Model, LLM)의 문맥 기반 인과 추론 능력을 활용하는 단계적 접근 방식을 채택하였다. 분석 데이터로는 중앙해양안전심판원 홈페이지에 등록된 2020년부터 2024년까지의 안전 사고 재결서를 수집하여 활용하였다. 수집된 데이터에서 세부 원인을 추출하고, 벡터 기반의 통계적 군집화 분석을 수행한 결과, 당사자, 지휘·협업, 설비·물적, 조직, 환경 요인의 5가지 분류 체계를 도출하였다. 도출된 체계를 적용하여 원인을 재분류한 결과, 기존 통계에서 ‘운항과실’과 ‘기타’ 등 소수 범주에 약 94% 이상 편중되어 있던 원인들이 책임 소재 및 시스템적 관점에 따라 ‘당사자 요인(40.6%)’과 ‘지휘·협업 요인(25.3%)’ 및 ‘설비·물적 요인(23.2%)’ 등으로 세분화되었다. 또한, 기존에 식별되지 않았던 의사소통 오류나 작업 환경 특성 등이 ‘조직 요인’ 및 ‘환경 요인’으로 명확히 구분되었다. 본 연구의 결과는 해양 안전사고의 원인을 책임 소재와 시스템적 차원에서 입체적으로 규명함으로써, 향후 실효성 있는 안전사고 예방 대책 수립을 위한 기초 자료로 활용될 것으로 기대한다.

키워드 : 거대 언어 모델 , 해양사고 재결서 , 해양사고 통계 , 해양사고 원인 분석 , 해양사고 원인 분류 ,

This article has been cited by 0 article in crossref

Cited-By

Funding:

1. 서 론

해양사고는 재산적 손실 뿐 아니라 환경오염 및 인명 피해 등 다양한 측면에서의 영향을 초래한다(Kim et al., 2024a). 해양사고로 인한 피해를 최소화하고 유사 사고의 재발 방지를 통한 해상 안전을 강화하기 위해서는, 과거 발생한 사고의 원인을 체계적으로 분석할 필요가 있다(Hwang et al., 2025).

우리나라는 물론, 세계 각국 및 국제기구에서도 해상 안전을 강화하기 위해 해양 사고 사례를 분석하고 이를 바탕으로 한 통계를 정리해 관리하고 있다.

우리나라는 해양 사고의 조사 및 심판을 담당하는 해양수산부 소속 해양안전심판원에서 주요 해양사고 사례집을 발간하고 매년 해양사고 통계를 공표하고 있으며, 해양사고 통계는 국가해사안전기본계획에 반영되어 해사안전정책 수립에 활용된다(Lee et al., 2019b;Korea Maritime Safety Tribunal, 2025). 국내 해양사고 통계는 선종, 톤수, 사고 위치, 시간, 유형 및 원인 등 다양한 기준을 활용한다. 현행 사고 유형별 원인 통계에서는 선종이나 사고 특성과 무관하게 모든 해양 사고에 동일한 3개 원인 분류를 적용하고 있다. 안전사고의 경우, 운항과실은 복무감독 소홀, 선내작업수칙 미준수, 경계소홀 등을 포함하며, 취급불량 및 결함은 설비 및 장비의 결함이나 기관설비 취급 불량 등의 원인을 포괄한다. 이 외 기상 현상과 같은 불가항력, 선박 운항관리 부적절 또는 승무원 배승 부적절 등은 기타에 포함된다. 이러한 분류는 사고의 표면적인 현상을 기술할 수는 있으나, 그 이면에 잠재된 ‘피로 누적’, ‘소통 부족’ 또는 ‘조직의 안전 문화’와 같은 근본적인 요인을 규명하는 데는 한계가 있다.

실제로 이러한 공식 통계의 한계는 선행 연구의 경향성으로도 이어진다. 해양사고 관련 선행 연구를 검토한 결과, 연도별 해양사고 통계와 재결 자료를 기반으로 수행한 단순 통계분석이 대다수를 차지하고 있었으며(Cho et al., 2017;Jung, 2018;Choi, 2021), 이러한 단순 통계분석은 결과 중심으로 다양한 사고 발생 요인을 제한하여 통계적 유의성을 찾는 데 한계가 있음이 지적된 바 있다(Lee et al., 2019b;Choi et al., 2021).

영국의 해양사고 조사 전문기관인 해양사고조사국(Marine Accident Investigation Branch, MAIB)은 연간 보고서를 통해 주요 사고별 교훈과 통계를 제공하며, 해당 통계에서는 해양 사고의 유형과 사고 직전에 사고로 이어진 직접적인 현상을 분류하고 있다(Marine Accident Investigation Branch, 2025). 국제노동기구(International Labour Organization, ILO)가 2025년 발간한 해상 사망사고 통계 보고서는 선박 운항과 관련하여 발생한 사고뿐만 아니라 질병 및 자살 등 선상에서 발생한 모든 사망 사고를 포괄적으로 다루고 있다. 또한, 이 보고서는 수집된 사망 데이터를 사망 원인, 사망자의 직급, 부서, 나이, 성별은 물론, 사고 당시 선박의 위치, 유형, 크기 등 다양한 변수로 상세하게 분류하여 분석했다(International Labour Organization, 2025). 그러나, MAIB와 ILO의 통계는 사고의 결과를 중심으로 하고 있어, 사고의 재발 방지 대책을 수립하기에 한계를 가진다.

한편, 호주 해사청(Australian Maritime Safety Authority, AMSA)의 경우, 사고의 근본적인 요인을 사람, 선상 상태, 선사 내부 조직 영향, 외부 조직적 영향, 환경 및 기술/장비의 6개 분류로 구분하여 입체적으로 분석하는 체계를 갖추고 있다(Australian Maritime Safety Authority, 2025). 유럽 해사안 전청(European Maritime Safety Agency, EMSA)은 해양사고 데이터베이스에서 각 사고별 발생 요인을 외부 환경, 선상 운용 및 육상 관리의 3개로 분류하고 있다. EMSA는 사고 요인의 70% 이상이 '선상 운용'으로 분류되어 책임 소재가 승선원에게 편중되는 문제를 개선하고자, 이를 인간의 행동, 환경, 도구·장비, 규칙·절차·훈련 등 4개 범주로 세분화하였다(European Maritime Safety Agency, 2024).

앞서 살펴본 국내외 해양사고 원인 통계는 사고의 결과 중심으로 제시되거나, 전문가의 주관적 판단에 의존하여 사고 이면에 잠재된 복합적인 원인을 규명하는 데에는 한계를 보인다. 따라서, 본 연구는 대규모 언어 모델(LLM)을 활용하여 중앙해양안전심판원에서 공개하는 재결서 원문의 비정형 텍스트를 분석하는 데이터 기반 접근 방법을 활용하고자 한다. 이는 기존의 평면적인 원인 분류를 넘어, 사고의 서술적 맥락 속에 잠재된 요인을 입체적으로 도출하고 구조화하는 것을 목적으로 한다.

2. 선행 연구

2.1 기존 사고 원인 분석 모델

해양사고를 포함한 안전사고의 근본적인 원인을 분석하기 위한 이론적 접근은 지속적으로 발전해 오고 있다. 먼저, 도미노 모델은 사고의 발생 과정을 사회·환경적 조건이 개인의 취약과 오류를 유발하고 이것이 불안전한 행위로 나타나면서 사고로 이어지는 연쇄적인 과정으로 설명한다 (Heinrich, 1941;Lundberg et al., 2009). 이는 순차적인 사고 모델의 기반이 되었으나, 복합적인 사고 원인을 분석하기에는 한계가 존재한다(Cho and Im, 2019). 스위스 치즈 모델은 조직, 절차 및 현장 등 다양한 측면에서의 잠재적 결함과 인간의 행동 오류 또는 위반이 특정 시점에 동시에 정렬될 때 사고가 발생한다고 보며, 분석 범위를 인적 과실을 넘어 조직· 시스템·환경 수준으로 확장한 것이 특징이다(Reason et al., 2006;Fukuoka and Furusho, 2016;Reason, 2016). 스위스 치즈 모델을 기반으로 개발된 HFACS(Human Factors Analysis and Classification System)는 사고 발생 원인을 인적 요인을 중심으로 조직의 영향, 불안전한 감독, 불안전한 행동에 대한 전 제조건 및 불안전한 행위의 네 단계로 구조화하여 원인을 체계적으로 분류한다(Shappell and Wiegmann, 2000;Kim et al., 2024b).

해양사고가 단일 요인이 아닌 여러 인적, 조직적, 환경적 요인의 복합적인 작용으로 발생한다는 점을 고려했을 때, 이러한 모델들은 사고의 전반적인 시스템적 이해를 위한 개념적 분석의 프레임워크를 제공한다는 점에서 의의가 크다. 그러나, 해당 모델들은 다수의 해양사고 재결서와 같은 비정형 텍스트 자료 바탕으로 분석하고자 하는 경우, 그 과정에서 많은 시간과 인력이 소요되고, 또한 분석자의 개입으로 인해 해석의 객관성이 일정하지 않을 수 있다는 한계가 존재한다.

2.2 텍스트 마이닝을 활용한 사고 분석

텍스트 마이닝은 자연어 처리 기술을 기반으로, 방대한 양의 비정형 또는 반정형 텍스트 데이터에서 유의미한 정보와 패턴을 추출하여 구조화하는 방법을 의미한다. 이러한 과정을 위해 텍스트를 형태소나 단어 단위로 분할한 후 정규화 등을 거쳐 분석 가능한 형태로 변환한다. 이후, 단어의 출현 빈도, 분류, 군집과 같은 구조적 관계를 파악하는 통계적 또는 규칙적 알고리즘을 활용한다. 결과적으로, 단순한 키워드 매칭을 벗어나 대량의 데이터에 숨겨진 분류나 연관 성을 탐색할 수 있다.

해양사고 분야에서도 텍스트 마이닝 기법을 활용하여 사고의 원인을 분석하려는 시도가 이루어지고 있다. Tirunagari (2015)는 영국 MAIB의 해양사고 보고서를 대상으로 텍스트 마이닝 기법을 적용하여 사고의 인과 관계 추출 가능성을 탐색하였다. 구체적으로 단어 빈도를 활용한 패턴 분류 방식과 Therefore와 같이 인과 관계를 나타내는 단어 기반의 분석 방식을 적용하였다. 그 결과, 해당 기법을 통해 추출된 정보가 사고 보고서 전체를 읽지 않고도 핵심 원인을 파악하는 데에 도움을 줄 수 있다는 전문가들의 평가를 받았다. 이를 통해 해양사고 보고서 분석에서 텍스트 마이닝의 적용 가능성을 확인했으나, 전문가의 검토를 거친 사고 보고서가 4건에 그쳐 일반화에는 제약이 따른다. Lee et al.(2019a)는 2008년부터 2017년까지 미국, 영국 및 독일 등에서 작성한 ECDIS(Electronic Chart Display and Information System) 관련 해양사고 보고서 12건을 바탕으로 사고 원인 분석 경향의 변화를 파악하고자 텍스트 마이닝 기법으로 분석을 시도하였다. 이 연구는 ECDIS 관련 사고 원인의 말뭉치의 빈도가 초기에는 '항해사'가 높게 나타났으나, 시간의 흐름에 따라 '시 스템'의 빈도가 높아지는 경향을 포착하였다. 그러나 저자들은 이 정량적 분석만으로는 ECDIS 사고의 원인을 정확하게 분석할 수 없다는 한계를 인정했으며, 단 12개의 보고서로 한정된 데이터의 제약과 함께 일부 전문 용어 해석에 전문가의 지식이 요구되는 점을 인지하였다.

국내 해양안전심판원의 재결서를 분석 대상으로 한 텍스트 마이닝 연구 사례도 살펴보았다. Lee(2023)는 재결서 내 인적 요인 관련 단어의 출현 빈도 분석과 의미 연결망 분석을 수행하여 해양사고의 주요 키워드를 도출하고 기존 통계와의 유사성을 확인하였다. Lee and Park(2020)와 Hur(2021)의 연구에서는 각각 도선과 예인선 관련 해양사고와 재결서 텍스트를 분석 대상으로 선정하였다. 이들은 단어의 빈도와 문서 간 희소성으로 가중치를 부여하는 TF-IDF 기법과 인적 요소와 소프트웨어, 하드웨어 및 환경 요소 간의 관계를 통해 사고 원인을 분석하는 SHEL Model을 기반으로 키워드를 추출 및 범주화하여 사고 원인을 분석하고자 했다. 그 결과, 분석 대상 사고가 인적요인 간 또는 인적요인과 환경 간 상호 작용과 같이 복합적인 요인에 기인한 것임을 밝히고 유형별 사고 예방책을 제시하였다. Yoon et al.(2023)은 20년간 부산지방해양지방심판원의 충돌사고 재결서를 대상으로 SentenceBERT(SBERT) 임베딩을 활용해 문장 간 의미 유사도 기반의 군집을 구성하고, 각 군집을 키워드 출현 빈도에 따라 글자 크기를 비례하여 나타내는 워드 클라우드 형태로 시각화하였다. 빈도 중심 요약을 넘어 문장 수준 의미를 반영해 유형을 분류했다는 점은 의의가 있으나, 워드 클라우드에서 ‘강조’, ‘선적’, ‘일인’, ‘일시’와 같이 형식적 및 절차적 용어가 두드러져 실질적 원인이 상대적으로 희석되는 한계가 있다.

해양교통안전공단은 해양교통안전정보시스템 서비스를 통해 중앙해양안전심판원 재결서를 바탕으로 환경·인적·설비 요인에 해당하는 용어 빈도 정보, TF–IDF 기반 워드 클라우드 및 키워드 간 네트워크 시각화 자료를 제공하고 있다(Korea Maritime Transportation Safety Authority, 2023). 이러한 서비스는 대규모 재결서의 핵심 어휘 경향을 신속히 파악하는 데 유용하나, 각 사고의 원인에 대한 문맥적 인과 구조를 확인하는 데에는 한계가 있다.

앞서 살펴본 텍스트 마이닝을 활용 사례들은 해양사고 분석에서 의미 있는 진전을 보였으나, 대부분 사고 보고서 내 단어 빈도 기반의 분석으로 맥락 기반의 의미 추론에서는 한정적인 접근을 보였다.

2.3 LLM을 활용한 사고 분석 사례

LLM은 방대한 양의 비정형 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성하는 능력을 갖춘 인공지능 모델이다. LLM은 기존 자연어 처리 모델 대비 복잡한 문맥 기반 추론과 의미론적 분석 능력이 뛰어나다. 다만, 학습 데이터에 따라 편향성이 존재할 수 있으며, 수십억 개의 파라미터를 저장, 추론 및 활용하기 위해 연산에 많은 자원과 시간이 요구된다(Bronsdon, 2024).

LLM을 활용한 사고 분석은 건설 현장이나 항공 분야에서 연구된 바 있다. Kim et al.(2023)은 건설현장에서 발생한 사상사고의 ‘사고 경위’ 텍스트를 대상으로 형태소 분석과 키워드 분류를 결합해 부상 부위를 머리·상지·하지·몸통·사망 예상으로 자동 분류하고, 분류 누락 사례에는 GPT-3.5-turbo 모델을 적용해 문맥 기반의 라벨링을 수행하였다. 이어 부상 부위를 공정·사고 유형 등과 연계해 연관성을 분석하였으며, 결과적으로 프롬프트 설계와 LLM을 활용한 비정형 텍스트 라벨링의 적용 가능성을 제시하였다.

Lee et al.(2024)은 항공 안전사고 보고서를 대상으로 사고 원인을 자동으로 추출하고자 AirGemma를 구축하였다. 해당 모델은 소형 언어모델인 Gemma2-2B에 도메인 특화 사전학습 기법(Gururangan et al., 2020)과 LLM의 부분 파라미터에 대한 미세조정 기법(Xu et al., 2023)을 순차 적용해 구축된 것으로, 10배 규모의 파라미터를 가진 GPT3.5-Turbo 모델 대비 우수한 사고 원인 추출 성능을 보였다. 또한, 외부 인터넷이 제한된 내부망 환경에서도 로컬 언어 모델의 운용이 가능함을 제시하여, 기밀성이 요구되는 환경에서의 항공 안전사고 보고서 분석의 자동화에 대한 가능성을 강조하였다.

이처럼 타 분야에서의 LLM 기반의 사고 분석 사례는 해양 사고 분석에 대한 적용 가능성을 시사한다. 따라서, 본 연구는 LLM의 문맥적 의미 이해 능력을 활용하여 해양사고 원인을 새롭게 분류하는 가능성을 탐색하고자 한다.

3. 방법론

본 연구는 해양사고 재결서 데이터에 내재된 복합적인 사고 원인을 규명하고 새로운 분류 체계를 구축하기 위해 LLM을 활용하였다. 기존 지식 기반 통계의 한계를 넘어 재결서 원문으로부터 사고 발생 요인을 직접 추출 및 분류하는 방식을 채택하였다. 전반적인 연구 흐름은 Fig. 1과 같이 분석 대상 데이터 준비, 새로운 분류 체계 수립 그리고 분류 체계 적용 및 비교 분석의 세 단계로 구성된다.

이러한 분석을 수행하기 위해, 로컬 LLM 플랫폼인 OLLAMA와 gpt-oss:20b 모델을 설치하고 이를 MATLAB과 연동하여 독립적인 분석 환경을 구축하였다.

3.1 분석 범위 선정 및 전처리

본 연구는 분석 범위를 전체 해양사고 중 인명 사상이 발생한 '안전사고'로 한정하였다. 이에 다른 사고 원인 분석을 위해 중앙해양안전심판원 홈페이지에 등록된 지난 2020년부터 2024년까지의 안전사고 재결서를 분석 대상으로 선정하였다.

수집된 재결서로부터 데이터 추출의 정확도를 높이고자, 원본 HWP 문서를 평문 텍스트 파일 형태인 TXT로 변환한 후 불필요한 공백을 제거하는 전처리 과정을 통해 LLM 분석에 적합한 형태로 정제하였다. 그리고, ‘1. 사실’, ‘2. 원인’, ‘3. 해양사고관련자의 행위’ 및 ‘4. 사고방지 교훈’으로 구성되는 재결서에서 사고의 원인이 핵심적으로 서술된 ‘2. 원인’ 부분의 비정형 텍스트를 별도로 추출하여 진행하였다.

3.2 LLM 기반 사고 원인 추론 및 분류

재결서 텍스트의 내재된 의미 구조와 인과적 관계를 파악하고자 LLM의 추론 능력을 활용하였다. 분석 모델 선정 시에는 재결서에 서술된 사고 원인과 조건, 결과 간의 인과관계를 구조적으로 추출하는 성능을 최우선으로 고려하였다. 본 연구에 활용된 gpt-oss:20b 모델은 해양 분야나 한국어에 특화된 모델은 아니나, 예비 분석 결과 재결서 문장 내 사고 인과 구조를 식별하고 추출하는 데 있어 비교적 높은 일관성을 보였다. 본 연구의 목적이 단순한 키워드 빈도 분석을 넘어 사고 맥락에 기반한 논리적 원인 식별과 분류 체계 구축에 있다는 점에서, 해당 모델의 추론 능력이 분석 목적에 부합하는 것으로 판단하였다. 이러한 추론 성능을 바탕으로 수행된 사고 원인의 해석과 분류 과정은 구체적으로 다음 네 단계를 거쳐 수행되었다.

1) 텍스트 정보의 벡터화 및 구조화

입력된 재결서 텍스트를 토큰 단위로 분할하고, 각 토큰을 문맥적 의미를 포함한 벡터로 변환하는 임베딩을 거친다 (Park et al., 2023). 이 과정에서 단어의 사전적 의미뿐만 아니라 문장 내 위치와 어순에서 기인하는 맥락적 특성을 포착하여, 행위 주체와 사고 결과 간의 의미론적 구조를 형성한다.
2) 문맥 내 정보 간 상호 연관성 분석

복잡한 문장 구조 안에서 각 단어가 갖는 맥락적 의미를 파악한다. 단순히 단어의 나열을 보는 것이 아니라, 사고 원인과 결과가 텍스트 내에서 어떻게 연결되는지 계산하여 정보의 중요도를 평가한다(OpenAI, 2021;Bandyopadhyay et al., 2022).
3) 인과 관계 추론

선행 단계에서 식별된 상호 연관성을 기반으로, 사고의 원인이 되는 조건부 확률 및 인과 연쇄를 추론한다. 이를 통해 사고 원인과 결과의 연쇄적 흐름을 인과 구조로 정리한다(Lee et al., 2025).
4) 확률적 결정

앞선 추론 과정을 통해 도출된 사고 원인 후보 중에서 텍스트의 전체 맥락과 가장 부합하는 해석을 확률적으로 평가하여 최종 선택한다(Kim and Yu, 2023;Ko and Kang, 2024).

앞서 설명한 네 단계는 사고 원인의 추출, 분류 체계 도출, 그리고 분류 체계 적용의 전반에 공통적으로 활용되며, 특히 ‘상호 연관성 분석–인과 관계 추론–확률적 결정’이 LLM기반 추론의 핵심을 이룬다.

3.2.1 사고 원인 추출

원인 분류 체계 구축을 위해 사고 원인을 추출하는 과정에 다음과 같은 원칙을 적용하였다. 첫째, 재결서에 서술된 텍스트를 구체적인 행위나 상태 단위로 분리하고, 이를 유발한 주체를 명확히 식별하였다. 둘째, 물리적 결과뿐만 아니라 판단 착오, 기상 악화, 작업 환경 특성 등 사고를 유발한 모든 잠재적 요인을 포함하였다. 셋째, 데이터 품질 관리를 위해 원본 텍스트에 기반하되, 의미상 중복을 제거하여 추출하였다. 이 과정은 인간의 인과 관계 추론을 기계적으로 모사하여, 단순한 현상 요약을 넘어 구체적인 원인 데이터를 확보하는데 중점을 두고 수행되었다.

3.2.2 원인 분류 체계 도출

다음으로는 전 단계에서 추출된 원인을 대상으로 의미적 군집화 분석을 수행하였다. 이 분석은 nomic 모델의 임베딩 값을 활용하여 추출된 원인을 벡터화하고, 각 벡터의 의미적 유사성을 기준으로 군집화하는 방식이다. 이때, 군집의 개수에 대한 통계적 타당성을 확보하고자 엘보우 기법(Elbow method; Hong, 2021) 및 실루엣 계수(Silhouette Coefficient; Park and Lee, 2022)를 적용하여, 최적의 값을 탐색하였다.

3.2.3 원인 분류 체계 적용

이 단계에서는 190건의 안전사고 재결서에 앞서 도출된 5 가지 분류 체계를 적용하여 재분류하였다.

먼저, 원인 식별 단계에서는 재결서 원문으로부터 사고 당시의 상황, 사고에 관여한 인적·물적·환경적 요소 그리고 피해자 정보를 추출하여 구조화하였다. 이러한 사실 기반 정보를 바탕으로 사고의 결정적 원인을 도출하였다.

다음으로 분류 단계에서는 식별된 원인 텍스트와 새로운 분류 정의 간의 의미적 유사도를 산출하여 분류를 결정하였다. 이는 원인 텍스트와 정의 간 맥락적 일치성을 평가함으로써 수기 분류 시 발생할 수 있는 일관성과 신뢰성 문제를 최소화하였다. 최종적으로 기존 통계를 대상으로 하여 새로운 분류 체계의 특성을 비교 분석할 수 있는 기반을 마련하 였다.

3.3 분류 결과 기반 통계 비교 분석

본 연구는 LLM 기반 분류의 효과를 입증하기 위해, 2020년부터 2024년까지 5년간의 안전사고 재결서를 대상으로 분석을 수행하였다. 새로운 원인 분류 체계를 적용한 결과를 기반으로, 5년간 안전사고 원인의 전반적인 분포 특징을 분석하고자 원인 비율을 산출하고 도식화하였다. 최종적으로, 도출된 결과를 기존 해양사고 원인 분류 체계와 비교하여 본 연구의 새로운 분류 체계의 특성을 분석할 수 있는 기반을 마련하였다.

4. 연구 결과

4.1 전처리 결과

본 연구는 중앙해양안전심판원 홈페이지에 공개된 2020년부터 2024년까지의 안전사고 재결서를 초기 데이터로 확보하였다. 그 중 데이터 접근이 불가능하거나 손상된 5건을 제외한 190건을 분석 대상으로 확정하였다. 최종 분석용 데이터세트는 190건의 재결서 중 사고 원인이 집중적으로 서 술된 '2. 원인' 부분의 텍스트로 구성되었다. 이 데이터는 불필요한 공백 및 이미지 데이터가 제거된 정제된 평문 텍스트 형태로 전처리되어, LLM 기반의 사고 원인 추출 및 분류를 위한 최종 분석 데이터 세트로 활용되었다.

4.2 LLM 기반 사고 원인 추론 및 분류 결과

4.2.1 사고 원인 추출 결과

총 190건의 재결서 내 텍스트 데이터를 기반으로 LLM을 활용하여 사고 원인을 추출한 결과, 총 739개의 원인이 추출 되었다. LLM은 문맥 기반 의미 해석과 논리적 관계 파악을 통해 각 문장 내에서 ‘원인(행위)-결과’ 구조를 분석하였으며, 그 결과 사고의 표면적 원인부터 근본적 원인까지 재결서에 서술된 모든 원인을 포괄적으로 추출할 수 있었다. 이 과정은 인간이 수행하는 복잡한 인과 관계 추론을 기계적으로 모사했다는 점에서 단순한 키워드 추출 및 빈도 확인과 차이를 보인다.

4.2.2 원인 분류 체계 도출 결과

Fig. 2에 제시된 바와 같이 엘보우 기법 적용 결과 군집의 수(k)가 5일 때, 오차제곱합(Sum of Squared Errors, SSE) 값의 변곡점이 나타났다. 이는 원인 데이터를 설명하는 데 통계적으로 적합한 군집 수가 5임을 의미한다. 또한, 군집의 응집도와 분리 정도를 종합적으로 나타내는 실루엣 계수 역시 군집의 수가 5개일 때 가장 높은 값으로 나타났다. 따라서, 두 통계적 기준에 따라 사고 원인 분류의 수를 5개로 확정하였다.

5개 분류는 Table 1과 같이 구분되었으며, 크게 세 가지 특징을 가진다. 첫째, 인적 요인의 구조적 분리이다. 기존 통계는 선내작업 안전수칙 미준수, 복무감독 소홀 등을 모두 ‘운항과실’이라는 단일 범주로 포괄하여 개인의 과실과 관리의 부재를 구분하기 어려웠으나 본 분류 체계는 이를 당사자 요인과 지휘·협업 요인으로 분리하였다. 이는 사고의 원인이 개인의 불안전한 행위인지, 현장 지휘 및 통제의 실패인지 구분하여 인적 요인에 대한 분석의 해상도를 높인다.

둘째, 잠재적 시스템 요인의 독립적 식별이다. 기존에 ‘기타’ 항목으로 분류되어 그 중요성이 겉으로 드러나지 않았던 선박 운항관리 부적절, 승무원 배승 부적절 등의 요인을 조직 요인으로 구분하였다. 특히, 기존 통계에서 원인으로 집계되지 않던 안전 경시 문화(Poor Safety Culture), 피로 등 선원의 건강 상태(Crew Health Condition) 및 의사소통 오류(Miscommunication)와 같은 위험 요인까지 식별하여 분류에 반영하였다. 이를 통해 사고를 유발하는 선박 운항 관리 체계의 구조적 문제를 명시적으로 드러낼 수 있다.

셋째, 환경적 요인의 구체화다. 기존 분류에서는 기상이나 해상 상태 같은 불가항력적 요인이 ‘기타’ 로 분류되어 환경적인 요인에 대한 파악에 한계가 있었다. 본 연구는 기상 및 해상 상태뿐 아니라 작업 환경 특성(Working Environment)까지 포괄하여 별도의 환경 요인으로 분류하였다. 이는 사고 발생에 대한 환경적 요인의 영향을 보다 체계적으로 분석할 수 있는 토대를 마련한다.

이러한 구조적 차별성은 기존 통계분류와 LLM 기반의 분류 체계 간의 관계를 도식화한 Fig. 3에서도 명확히 나타난다. 먼저, 운항과실의 입체적 재해석이다. 기존에 운항과실 로만 분류되었던 선내작업 안전수칙 미준수의 경우 사고 맥락에 따라 당사자 요인 또는 지휘·협업 요인으로 구분되었다. 또한, 기계적 결함 역시 단순한 장비 문제가 아닌 인적 조작 실수나 감독 소홀이 개입된 경우와 같이 복합적인 요인을 고려하였다. 특히, 기존 통계에서 식별되지 않았던 의사소통 오류, 안전 경시 문화, 선원의 건강상태 및 작업환경이 새롭게 식별되어 분류 체계에 반영됨으로써 사고 원인 분석의 해상도가 개선되었다.

따라서, 이러한 변화는 LLM 기반의 분류 체계가 기존의 통계 분류에 비해 사고 원인을 세밀하고 구조적인 관점에서 입체적으로 규명할 수 있음을 시사한다.

4.2.3 원인 분류 체계 적용 결과

새롭게 정한 5가지 분류 체계를 기준으로 수집한 각 재결서의 사고 원인을 재분류하였다. 재분류 결과, 전체 원인 중 당사자 요인(40.6%)이 가장 높은 비율을 차지했으며, 뒤이어 지휘·협업 요인(25.3%), 설비·물적 요인(23.2%), 환경요인(5.8%) 조직요인(5.2%) 순으로 나타났다.

4.3 분류 결과 기반 통계 비교 분석

Fig. 4는 앞서 수집한 재결서에 대해 중앙해양안전심판원의 안전사고 원인 분류를 안쪽 원에 제시하고, 이를 LLM 기반의 새로운 분류 기준에 따라 재분류한 결과를 바깥쪽 원에 나타낸 그래프이다. 이를 통해 기존 각 분류가 새로운 체계에서 어떤 요인들로 재구성되는지를 시각적으로 확인할 수 있다.

기존 통계에서 약 60%을 차지했던 운항과실(Operating Negligence) 항목은 새로운 분류를 통해 당사자 요인(27.4%)과 지휘·협업 요인(13.2%)으로 분리되었다. 운항과실의 주요 항목인 ‘선내작업 안전수칙 미준수’로 포괄되었던 원인들이 개인의 행위와 현장 관리·감독 문제로 분산되었음을 보여준다. 추가로, 운항 과실로 분류되었던 원인의 상당수가 설비· 물적 요인(13.2%)으로 재분류된 점에 주목할 만하다. 이는 기존의 ‘취급불량 및 결함’ 항목이 선체, 기관, 화기 또는 전선 등 제한적인 물리적 설비에만 국한되어 있었기 때문이다. 그 결과, 양망기나 윈치를 비롯한 다양한 선내 장비가 ‘취급불량 및 결함’에 제대로 반영되지 못했고, 이들 장비의 노후화, 결함, 부적절한 보수가 설비 요인으로 분류되지 못한 채 ‘운항 과실’이라는 항목에 포괄적으로 다뤄져왔다는 점을 시사한다.

전체 원인의 약 5.8%를 차지하던 ‘취급불량 및 결함’은 설비·물적 요인(2.1%)과 당사자 및 지휘·협업(각 1.6%)로 세분화되었다. 이는 기존 분류에서 혼재되어 있던 기계적 결함과 취급 불량을 분리하여, 안전사고의 원인이 장비의 내재적 문제인지 운용상의 문제인지 구분할 수 있는 방법론적 토대를 마련했다는 점에서 의의를 찾을 수 있다.

무엇보다 전체의 약 34.2%를 차지했던 ‘기타(Miscellaneous)’ 항목의 재분류 결과는, 기존 통계의 포괄적인 범주 내에 서로 다른 성격의 요소들이 혼재되어 있었음을 실증적으로 입증한다.

분석 결과, ‘기타’ 항목의 대다수는 당사자 요인(11.6%), 지휘·협업 요인(10.5%), 설비·물적 요인(7.9%)으로 재배치되었다. 이는 기존 통계에서 ‘기타’로 처리되던 사고의 상당수가 실제로는 구체적인 인적 과실이나 장비 문제였음에도 불구하고, 명확한 분류 기준의 부재로 인해 ‘기타’ 항목으로 귀속되어 왔음을 의미한다. 또한, 조직 요인(2.1%)과 환경 요인(2.1%)이 독립적으로 구분됨으로써, 기존에는 통계적으로 규명되지 않았던 시스템적 미비나 외부 환경의 영향이 구체적인 분석 단위로 가시화될 수 있음을 확인하였다.

종합적으로, 이러한 비교 분석 결과는 LLM 기반 분류 체계가 기존 통계의 구조적 편중을 해소하고, 사고 원인을 책임 주체와 시스템적 차원에 따라 다층적으로 재분류하는데 효과적이었음을 뒷받침한다.

5. 결 론

본 연구는 거대 언어 모델의 문맥 추론 능력을 활용하여, 2020년부터 2024년까지 발생한 해양 안전사고 재결서 내 비정형 텍스트 데이터로부터 사고 원인을 추출하고, 데이터 기반의 새로운 분류 체계를 구축하여 제시하였다. 다음과 같은 세 가지 측면에서 안전사고 원인에 대한 기존의 분석 및 통계의 한계를 극복하였다.

1) 데이터 기반의 원인 분류 체계 효용성 입증

기존 통계에서는 약 94% 이상이 '운항과실'과 '기타' 두 가지 범주에 편중되어 구체적인 원인 식별이 어려웠다. 본 연구는 이를 당사자(40.6%), 지휘·협업(25.3%), 설비·물적(23.2%), 환경(5.8%), 조직(5.2%) 요인으로 세분화하여, 사고 원인을 다각도에서 정량적으로 분석할 수 있는 체계를 마련하였다.
2) 해양 안전사고 분석의 효율성 및 객관성 제고

방대한 양의 재결서 텍스트를 LLM을 통해 자동화된 방식으로 분석함으로써, 기존 수기 분석 방식이 가진 시간적 비효율성과 분석자의 주관적 개입에 대한 의존성 문제를 극복하였다. LLM을 통해 의미 패턴을 학습하고 벡터 유사도 기반의 군집화는 단순 빈도 분석을 넘어 맥락적 인과성을 반 영한 객관적 분석 방법론의 토대를 마련하였다.
3) 시스템적 사고 원인 규명 및 예방 대책의 방향성 제시

사고 원인을 개인 과실을 넘어 지휘·감독 및 조직적 미비점 등 시스템적 차원에서 입체적으로 규명하였다. 특히 기존 통계에서 간과된 선원 건강상태, 의사소통 오류, 작업 환경 특성을 독립 요인으로 식별함으로써, 향후 안전사고 예방 대책이 개인에 대한 교육을 넘어, 조직 안전 문화 및 작업 체계 개선 등 실효성 있는 정책 방향으로 전환되어야 함을 시사한다.

이러한 측면에서 본 연구 결과는 안전사고 맞춤형 예방 대책 수립 및 실효성 있는 정책 마련을 위한 정량적 근거 자료로 활용될 수 있을 것으로 기대된다. 다만, 본 연구는 분석 대상을 2020년부터 2024년까지의 안전사고 재결서로 한정하여, 시간적 범위 및 사고 종류 범위에서 한계를 가진다. 따라서, 향후 연구에서는 분석 대상 기간을 확대하고 충돌· 좌초·전복 등 다양한 사고 유형으로 확장하는 한편, 기상·해상 데이터 등 외부 정량 자료와의 융합 분석을 통해 원인 분석의 일반화 가능성과 정밀도를 제고하고자 한다.

Figure

Fig. 1.

Research Flow.

Fig. 2.

Optimal Cluster Number Determination using Elbow and Silhouette Analysis.

Fig. 3.

Classification System Structure and Differentiation Mapping

Fig. 4.

Comparative Analysis of Classification (KMST vs. LLM-derived).

Table

Table 1.

Category according to Data-Derived Classification

Category	Description
Personnel Factors	Negligence, procedure non-compliance, lack of proficiency, or lack of attention by the individual casualty involved.
Supervision and Teamwork Factors	Collaboration errors, ambiguous instructions, surveillance neglect, or on-site control failure by supervisors or peers, excluding the person directly involved in the accident.
Equipment Factors	Defects, failure, or poor maintenance of equipment, machinery, or vessel structure.
Organizational Factors	Organizational safety culture, and the absence or deficiency of company-level safety management systems, training, or policies.
Environmental Factors	External environmental causes, including physical factors of the working environment, such as weather, sea state, atmospheric conditions, and slippery deck surfaces.

Reference

Australian Maritime Safety Authority ( 2025), Marine Incident Annual Report 2024.
Bandyopadhyay, S., J. Xu, N. Pawar, and D. Touretzky ( 2022), Interactive visualizations of word embeddings for K-12 students. Proceedings of the AAAI Conference on Artificial Intelligence, 36(11), pp. 12713-12720.
Cho, H. K., B. S. Park, D. H. Kang, and S. S. Kim ( 2017), The Main factor and Counterplan for Marine accidents in Korea. Journal of Fisheries and Marine Sciences Education, 29(3), pp. 746-756.
Cho, C. Y. and J. J. Im ( 2019), A study on a hybrid approach-based accident investigation model: with an application to Sewol ferry disaster. Korean Policy Sciences Review, 23(4), pp. 87-111.
Choe, C. W., Y. N. Noh, D. S. Shin, H. M. Kim, and H. C. Park ( 2021), Identifying Risk Factors of Marine Accidents in Coastal Area by Marine Accident Types. Journal of Korean Society of Transportation, 39(4), pp. 540-554.
Choi, J. Y. ( 2021), A study on the causes of marine accidents and prevention of marine accidents in vessels. Cultural Interaction Studies of Sea Port Cities, 25, pp. 337-359.
Conor Bronsdon ( 2024), Comparing LLMs and NLP Models: What You Need to Know. Retrieved from https://galileo.ai/blog/comparing-llms-and-nlp-models-what-you-need-to-know.
European Maritime Safety Agency ( 2024), Annual Overview of Marine Casualties and Incidents 2024.
Fukuoka, K. and M. Furusho ( 2016), Relationship between latent conditions and the characteristics of holes in marine accidents based on the Swiss cheese model. WMU Journal of Maritime Affairs, 15(2), pp. 267-292.
Gururangan, S., A. Marasović, S. Swayamdipta, K. Lo, I. Beltagy, D. Downey, and N. A. Smith ( 2020), Don't stop pretraining: Adapt language models to domains and tasks. arXiv preprint arXiv:2004.10964.
Heinrich, H. W. ( 1941), Industrial Accident Prevention. A Scientific Approach.
Hong, D. K. ( 2021), NoSQL Database Partition using K-means Clustering. Journal of Korean Institute of Intelligent Systems, 31(5), pp. 416-421.
Hur, H. S. ( 2021), Study on the Cause Analysis of Accidents related to Tugboat : Analysis of Accident Causes using Text mining techniques and SHEL modes [Master's Thesis, Korea University].
Hwang, Y. E., S. H. Park, and K. J. Lee ( 2025), Modeling maritime distress accident prediction using oceanic meteorological data. The Korean Data & Information Science Society, 36(3), pp. 517-528.
International Labour Organization ( 2025), Global register of fatalities at sea: Experimental data collection.
Jung, C. H. ( 2018), A study on the improvement of safety by accidents analysis of fishing vessels, Journal of Fisheries and Marine Sciences Education, 30(1), pp. 179-186.
Kim, D. H., S. J. Lee, S. H. Jo, S. K. Park, and H. R. Bae ( 2024a), A Study on the Derivation of Sea Grid and Severity Indicators Based on Maritime Accident Data. Journal of Society for e-Business Studies, 29, pp. 57-72.
Kim, H. B. and Y. G. Yu ( 2023), Development of a Regulatory Q&A System for KAERI Utilizing Document Search Algorithms and Large Language Model. Journal of the Korea Industrial Information Systems Research, 28(5), pp. 31-39.
Kim, J. H., C. K. Park, and G. S. Jang ( 2024b), The Analysis of the Cause of Electrical Shock Accidents Using the HFACS Technique. Journal of the Korea Safety Management & Science, 26(4), pp. 23-32.
Kim, J., J. H. Kim, and B. Y. Kim ( 2023), Identification and analysis of injured parts of workers in construction site accident data using morphological analysis and LLM. Proceedings of Symposium of the Korean Institute of communications and Information Sciences.
Ko, E. B. and P. S. Kang ( 2024), Assessing Code Proficiency of Large Language Models for Machine Learning Problems. Korea Computer Congress 2024.
Korea Maritime Safety Tribunal ( 2025), Marine accident statistics report 2024 (Report No. 11-1192252-100001-10). Ministry of Oceans and Fisheries.
Korea Maritime Transportation Safety Authority ( 2023), Maritime transportation safety information system. Retrieved from: https://mtis.komsa.or.kr/gs/gisAnlz/acdntAnlz.
Lee, D. G., S. W. Park, Y. R. Hwang, H. S. Kim, H. W. Oh, J. W. Kim, M. Y. Cha, S. Y. Park, and J. H. Kim ( 2025), Benchmarking LLM Causal Reasoning with Scientifically Validated Relationships. arXiv e-prints, arXiv-2510.
Lee, E. K. and Y. S. Park ( 2020), A Study on Cause Analysis of Accidents related to Pilotage in Korean Waterways. Journal of Korean Maritime Police Science, 10(2), pp. 109-129.
Lee, J. H. ( 2023), A Study on Data Mining Analysis of Human Factors in Marine Accidents : Focused on Human Error. Cultural Interaction Studies of Sea Port Cities, 28, pp. 355-373.
Lee, J. S., B. K. Lee, and I. S. Cho ( 2019a), Text Mining Analysis Technique on ECDIS Accident Report. Journal of The Korean Society of Marine Environment & Safety, 25(4), pp. 405-412.
Lee, Y. J., S. K. Kang, and J. Y. Gu ( 2019b), A study on marine accident ontology development and data management: based on a situation report analysis of southwest coast marine accidents in Korea. Journal of the Korean Society of Marine Environment & Safety, 25(4), pp. 423-432.
Lee, H. Y., S. W. Lee, and W. I. Choi ( 2024), Automatic Extraction of Safety Accident Causes Using an Aviation- Specialized Language Model. The Journal of Korean Institute of Next Generation Computing, 20(6), pp. 56-68.
Lundberg, J., C. Rollenhagen, and E. Hollnagel ( 2009), What-You-Look-For-Is-What-You-Find–The consequences of underlying accident models in eight accident investigation manuals. Safety science, 47(10), pp. 1297-1311.
Marine Accident Investigation Branch ( 2025), MAIB Annual Report 2024 - Marine Accident Recommendations and Statistics.
OpenAI ( 2021), New and Improved Embedding Models, Retrieved from: https://openai.com/blog/new-and-improvedembedding-model/.
Park, C. J., W. S. Lee, Y. G. Kim, J. H. Kim, and H. S. Lee ( 2023), Survey on Large Language Models. Communications of the Korean Institute of Information Scientists and Engineers, 41(11), pp. 8-24.
Park, S. and D. Lee ( 2022), Classification of news app user types using k-means clustering and principal component analysis. In Proceedings of the Korean Computer Congress 2022, pp. 1372-1374.
Reason, J. ( 2016), Managing the risks of organizational accidents. Routledge.
Reason, J., E. Hollnagel, and J. Paries ( 2006), Revisiting the Swiss cheese model of accidents. Journal of Clinical Engineering, 27(4), pp. 110-115.
Shappell, S. A. and D. A. Wiegmann ( 2000), The human factors analysis and classification system-HFACS.
Tirunagari, S. ( 2015), Data mining of causal relations from text: analysing maritime accident investigation reports. arXiv preprint arXiv:1507.02447.
Xu, L., H. Xie, S. Z. J. Qin, X. Tao, and F. L. Wang ( 2023), Parameter-efficient fine-tuning methods for pretrained language models: A critical review and assessment. arXiv preprint arXiv:2312.12148.
Yoon, B. R., S. K. Park, H. R. Bae, and S. H. Sim ( 2023), Maritime Safety Tribunal Ruling Analysis using SentenceBERT. Journal of The Korean Society of Marine Environment & Safety, 29(7), pp. 843-856.