Journal Search Engine

ISSN : 1229-3431(Print)
ISSN : 2287-3341(Online)

Journal of the Korean Society of Marine Environment and Safety Vol.32 No.2 pp.390-398
DOI : https://doi.org/10.7837/kosomes.2026.32.2.390

Construction of Risk Network and Identification of Critical Equipment Based on HAZOP Data from LNG Equipment Test Facility

Soohyun Kim^*, Jinwon Jung^**†, Jaewoong Shin^**, Borim Ryu^**, Junbae Kim^***, Soonhyeong Kown^***

^*Principal Researcher, Korea Maritime Equipment and Research Institute, Busan 46744, Korea
^**Principal Researcher, Korea Maritime Equipment and Research Institute, Busan 46744, Korea
^***Senior Researcher, Korea Maritime Equipment and Research Institute, Busan 46744, Korea

* First Author : shkim@komeri.re.kr, 051-400-5439

^† Corresponding Author : jungjw@komeri.re.kr, 051-400-5472

Received March 27, 2026 Review April 24, 2026 Accepted April 27, 2026

Abstract

This study proposes a framework for preprocessing unstructured HAZOP (Hazard and Operability Study) data using regular expressions and analyzing risk networks to enhance safety management of an LNG equipment test facility. The analysis included 392 valid scenarios from a HAZOP workshop conducted on an LNG equipment test facility at the Korea Marine Equipment Research Institute (KOMERI). First, equipment tags with inconsistent notations in the HAZOP worksheets were standardized through regex-based preprocessing. Cause-Safeguard response relationships were then extracted to construct a risk knowledge graph comprising 84 nodes and 944 directed edges. Subsequent degree centrality analysis revealed that the level transmitter LT101 (degree centrality: 0.7108) and other highly ranked instrumentation devices serve as critical nodes performing common safeguard functions across all operational modes. Notably, the top five devices (LT101, LT201, PIT001, PIT101 and PIT201) exhibited degree centrality values more than 2.41 times the network average, quantitatively demonstrating the structural concentration of safeguard functions that is difficult to identify through conventional qualitative HAZOP analysis. The proposed framework complements expert-dependent qualitative risk assessment with data-driven quantitative analysis and provides a reusable data foundation for safety analysis of similar facilities.

Key Words : HAZOP , Knowledge Graph , Network Centrality Analysis , Regular Expression , LNG Equipment Test Facility , Risk Assessment

LNG 기자재 실증설비의 HAZOP 데이터 기반 위험 네트워크 구축 및 핵심 장비 도출

김수현^*, 정진원^**†, 신재웅^**, 류보림^**, 김준배^***, 권순형^***

^*(재)한국조선해양기자재연구원 책임연구원
^**(재)한국조선해양기자재연구원 책임연구원
^***(재)한국조선해양기자재연구원 선임연구원

초록

본 연구에서는 LNG 기자재 실증설비의 안전 관리 고도화를 위해, 비정형 HAZOP(Hazard and Operability Study) 데이터를 활용한 정규표현식 기반 데이터 전처리 및 위험 네트워크 분석 프레임워크를 제안하였다. (재)한국조선해양기자재연구원(KOMERI)에 구축된 LNG 기자재 실증설비에 대해 수행된 HAZOP 워크숍의 392건 유효 시나리오를 분석 대상으로 하였다. 먼저, 정규표현식을 활용하여 워크 시트 내 장비 태그의 비표준 표기를 표준화하고, Cause-Safeguard 간 인과관계를 추출하여 84개 노드와 944개 방향성 엣지로 구성된 위험 지식그래프를 구축하였다. 이후 네트워크 연결 중심성 분석을 수행한 결과, 레벨 트랜스미터 LT101(연결 중심성 0.7108)을 비롯한 상위 계 측 장비군이 설비 전체 운전 모드에 걸쳐 공통 방호 기능을 수행하는 핵심 노드임을 정량적으로 식별하였다. 특히 상위 5개 장비(LT101, LT201, PIT001, PIT101, PIT201)는 네트워크 평균 중심성 대비 2.41배 이상의 높은 연결 중심성을 나타내어, 기존 정성적 HAZOP에서는 명시 적으로 드러나기 어려운 방호 기능의 구조적 집중 현상을 데이터 기반으로 가시화하였다. 본 연구의 프레임워크는 기존 전문가의 직관에 의존하던 정성적 위험 평가를 정량적으로 보완할 수 있으며, 향후 유사 설비의 안전 분석에 재활용 가능한 데이터 기반을 제공한다.

키워드 : HAZOP , 지식그래프 , 네트워크 중심성 분석 , 정규표현식 , LNG 기자재 실증설비 , 위험성 평가

This article has been cited by 0 article in crossref

Cited-By

Funding:

1. 서 론

1.1 연구 배경

국제해사기구(IMO)의 환경 규제 강화에 따라 LNG, 암모 니아 등 대체연료를 사용하는 선박 기자재 기술이 급격히 발전하고 있으며, 이에 따라 기자재의 성능 검증을 위한 실 증설비(Test Facility)의 중요성이 대두되고 있다. 실증설비는 정형화된 운전 모드를 갖는 상용 선박과 달리, 유량·압력· 온도 등 운전 조건을 수시로 변경해야 하는 동적(Dynamic) 특성을 가지며, 이에 따른 잠재적 위험 요소 또한 가변적이 고 복잡하다. 설비의 위험성 평가 기법으로는 FMEA(Failure Mode and Effects Analysis)와 HAZOP(Hazard and Operability Study)이 대표적이다. FMEA는 개별 부품의 고장 모드와 그 영향을 분석하는 상향식(Bottom-up) 기법으로, 기계 부품 단 위의 신뢰성 분석에 유리하다(Stamatis, 2003). 반면 HAZOP은 공정 변수의 이탈을 가이드 워드 기반으로 분석하는 하향식 (Top-down) 기법으로, 유량·압력·온도 등 공정 변수의 이탈이 핵심 위험 요인인 설비에 더 적합하며, IEC 61882 및 IMO 가 이드라인에서도 공정 설비의 위험성 평가에 HAZOP을 권고 하고 있다. 본 연구의 대상인 LNG 기자재 실증설비는 다양 한 운전 모드에서 공정 변수의 동적 변화가 핵심 위험 요인 이므로 HAZOP을 채택하였다. 하지만 기존 HAZOP 수행 방 식에는 다음과 같은 한계가 지적되어 왔다(Dunjó et al., 2010;Crawley and Tyler, 2015). 첫째, 데이터의 비정형성으로 인한 재사용의 어려움이다. HAZOP 은 진행자(Facilitator)와 서기 (Scribe), 참여 전문가의 주관적 표현에 따라 작성 스타일이 상이하며, 데이터베이스화되지 못한 채 문서 형태로만 보관 되는 경우가 대부분이다. 이로 인해 유사 공정의 과거 데이 터를 신규 프로젝트에 재활용하거나 통계적으로 분석하는 데 막대한 시간과 비용이 소요된다. 둘째, 노드(Node) 단위의 파편화된 분석으로 인한 시스템적 위험 파악의 한계이다. HAZOP은 개별 이탈(Deviation)을 분석하는 데는 유리하지만, 특정 장비의 고장이 다른 공정으로 전파되는 연쇄적 파급 효과나 특정 방호장치(Safeguard)에 위험이 집중되는 구조적 취약점을 규명하기에는 한계가 있다. 수백 건의 시나리오 속에 내재된 장비 간 상호연관성(Interconnectivity)을 직관적 으로 파악하기 어려운 것이다. 셋째, 실증설비 고유의 동적 특성 반영이 부족하다. 쿨다운(Cool-down), 퍼징(Purging), 가 압 등 운전 조건이 수시로 변경되는 실증설비에서, 정적인 (Static) 문서 기반의 HAZOP은 다양한 운전 모드의 변화와 그에 따른 위험 요소를 유기적으로 연결하여 관리하기 어 렵다.

최근에는 인공지능(AI) 기술을 HAZOP에 접목하려는 연구 가 다양하게 보고되고 있다. Zhao et al.(2022)과 Wang et al.(2022)은 딥러닝 기반 개체명 인식 모델을 활용하여 HAZOP 텍스트에서 지식을 추출하고 지식그래프를 구축하는 방법 론을 각각 제안하였으며, Guo et al.(2025)은 이를 발전시켜 온톨로지 설계와 정보 추출의 이중 최적화 방법론을 통해 HAZOP 지식그래프 구축 정확도를 93% 이상으로 향상시켰 다. 또한 Lee et al.(2025)는 LLM을 전처리 도구로 활용하여 HAZOP 텍스트의 비표준 표현을 표준화한 뒤 머신러닝 모델 과 결합하는 통합 예측 프레임워크를 제안하였다. 그러나 이들 연구는 주로 텍스트 '생성', '추출' 또는 '등급 예측'에 초 점을 두고 있어, 이미 구축된 방대한 HAZOP 데이터를 '구조 화'하여 시스템 전체의 위험 전파 경로를 파악하는 연구는 상대적으로 부족하다. 또한 딥러닝 기반 접근법은 대규모 학습 데이터에 의존적이므로, 실증설비와 같이 운전 조건이 특수하고 도메인 특이적(Domain-specific)인 환경에서는 환각 (Hallucination) 문제와 함께 구체적인 설비 간 인과관계를 정 밀하게 식별하는 데 한계가 존재한다. 따라서 AI 기반 자동 화 이전에, 비정형 HAZOP 데이터를 컴퓨터가 처리 가능한 형태로 구조화하고 핵심 위험 장비를 정량적으로 식별하는 전처리 단계가 선행되어야 한다.

1.2 연구 목적

본 연구에서는 (재)한국조선해양기자재연구원(KOMERI) 에서 구축한 LNG 기자재 실증설비의 실제 HAZOP 데이터를 대상으로, 정규표현식 기반 데이터 전처리 및 위험 네트워 크 분석 프레임워크를 제안한다. 실증 설비의 안전 관리는 HAZOP 결과를 수동으로 검토하여 정비 우선 순위를 결정하 고 있으나 392건의 시나리오에 산재된 장비 간 상호연관성 을 수작업으로 파악하는데 막대한 공수가 소요되며, 어떤 장비에 관리 자원을 집중해야 하는지에 대한 객관적이고 정 량적 기준이 부재한 상황이다. 본 연구는 수백 건의 시나리 오에 산재된 장비 간 상호연관성을 종합적으로 파악하여 “어떤 장비가 시스템 안전의 핵심인가”를 데이터 기반의 정 량적 분석으로 해결하고자 한다.

본 연구의 구체적인 목표는 다음과 같다. 첫째, 정규표현 식(Regular Expression, Regex)을 활용하여 HAZOP 워크시트 내 장비 태그의 비표준 표기를 표준화하는 데이터 전처리 방법 론을 제시한다. 둘째, 구조화된 데이터를 기반으로 위험 지 식그래프(Risk Knowledge Graph)를 구축하고, 네트워크 연결 중심성 분석(Degree Centrality Analysis)을 수행하여 시스템의 안전 무결성을 좌우하는 핵심 장비(Critical Node)를 정량적으 로 도출한다. 이를 통해 기존 전문가의 직관에 의존하던 정 성적 평가 방식을 데이터 기반의 정량적 분석으로 보완하 고, 향후 정량적 위험 평가 및 지능형 안전 관리 시스템 구 축을 위한 데이터 기반을 마련하고자 한다.

2. 이론적 배경

2.1 HAZOP 의 한계와 디지털 전환

HAZOP은 공정 변수의 이탈(Deviation)을 가이드 워드 (Guide Word)와 결합하여 잠재적인 위험과 운전상의 문제점 을 식별하는 정성적 위험성 평가 기법이다(IEC 61882). 전문 가 브레인스토밍을 통해 다양한 시나리오를 체계적으로 도 출할 수 있다는 장점이 있으나, 결과물이 비정형 텍스트 형 태의 워크시트로 작성된다는 구조적 한계가 지적되어 왔다.

텍스트 마이닝 기반 지식그래프는 이러한 비정형 안전 데 이터를 구조화하여 위험성 평가에 활용하는 방법론으로 주 목받고 있다. Liu and Yang(2022)은 텍스트 마이닝을 통해 철 도 사고/사건 보고서로부터 지식그래프를 구축하고 이를 위 험 수준 정량 평가에 적용함으로써, 비정형 사고 데이터의 구조화가 시스템 안전 분석의 객관성을 향상시킬 수 있음을 실증하였다.

선행 연구들은 텍스트 기반 HAZOP 결과물이 문서 내에 고립되어 재사용이 어려운 데이터 섬(Data Island) 현상을 공 통적으로 지적하며, 이를 해결하기 위한 지식그래프 기반 구조화 방법론을 제안하였다(Zhao et al., 2022;Wang et al., 2022). Zhao et al.(2022)은 양방향 그래프 신경망에 멀티헤드 어텐션 메커니즘을 결합한 딥러닝 모델(BI-GAT-CRF)을 활용 하여 석유화학 분야 HAZOP 텍스트에서 91% 이상의 정밀도 로 개체명을 인식하고 반자동화된 HAZOP 지식그래프를 구 축하였다. Wang et al.(2022)은 HAZOP 보고서 내 비표준화된 다양한 표현을 통합할 수 있는 산업안전지식 표준화 프레임 워크(ISKSF)와 딥러닝 기반 정보 추출 모델(HAINEX)을 결합 하여 산업 안전 지식그래프(ISKG)를 구축하고, 석탄 액화 공 정에 적용하여 위험 전파 추론 및 지식 재사용 가능성을 실 증하였다. 그러나 이들 연구는 정적(Static) 운전 조건을 전제 로 하고 있어, 본 연구 대상인 실증설비와 같이 운전 모드가 수시로 변경되는 동적 환경에서의 직접 적용에는 현실적 제 약이 따른다.

한편, 최근에는 인공지능(AI) 기술을 HAZOP에 더욱 적극 적으로 접목하려는 연구가 진행되고 있다. Guo et al.(2025)은 IEC 61882 기반 위험 시나리오 온톨로지(HHSO)와 다중 특성 융합 개체명 인식 모델(MFFNM)을 결합하는 이중 최적화 방 법론을 제안하여 HAZOP 지식그래프 구축의 정확도를 93% 이상으로 향상시켰다. Lee et al.(2025)는 로컬 LLM을 전처리 도구로 활용하여 HAZOP 텍스트의 비표준 표현을 표준화한 뒤 다중출력 로지스틱 회귀모델과 결합하는 통합 예측 프레 임워크를 제안하고, 위험 빈도·강도 예측 정확도를 90% 이 상으로 개선하였다. 그러나 이들 연구는 주로 텍스트 '생성', '추출' 또는 '등급 예측'에 초점이 맞춰져 있으며, 이미 구축 된 HAZOP 데이터를 어떻게 '구조화'하여 장비 간 위험 전파 경로를 시스템 차원에서 분석할 것인가에 대한 연구는 상대 적으로 부족한 실정이다. 또한 이들 딥러닝 및 LLM 기반 접 근법은 대규모 주석 학습 데이터와 상당한 연산 자원을 전 제로 하므로, 실증 규모의 소규모 설비 HAZOP 데이터에 직 접 적용하기에는 현실적 제약이 따른다.

따라서 본 연구에서는 AI 기반 자동화의 전 단계로서, 비 정형 HAZOP 데이터를 텍스트 마이닝(Text Mining) 기법으로 구조화하고, 이를 지식그래프 및 네트워크 분석에 적용하는 접근법을 채택하였다.

2.2 지식그래프 및 네트워크 중심성 분석

지식그래프는 현실 세계의 개체(Entity)와 그들 간의 관계 (Relation)를 그래프 구조로 표현한 데이터 모델로, 수학적으 로는 G = (V, E)로 정의된다. 여기서 V 는 노드(Node)의 집 합, E는 엣지(Edge)의 집합을 의미한다.

HAZOP 데이터에 지식그래프를 적용할 경우, 장비 (Equipment), 원인(Cause), 결과(Consequence), 방호조치 (Safeguard)를 각각 노드로 정의하고, 이들 사이의 인과관계 를 엣지로 연결함으로써 복잡한 공정 위험을 시각화할 수 있다. 다만, 본 연구에서는 Cause와 Safeguard 항목에서 추출 된 장비 태그만을 노드로 활용하였다. Consequence 항목은 "LNG 누출로 인한 화재 위험" 등 서술문 형태로 기록되어 정규표현식 기반의 장비 태그 추출이 불가하였으며, 이에 대한 구조화는 자연어처리(NLP) 기반 개체명 인식(NER) 등 별도의 방법론이 요구되므로 향후 연구 과제로 남겨둔다.

구축된 지식그래프에서 시스템의 안전에 가장 큰 영향을 미치는 노드를 식별하기 위해 네트워크 중심성 분석을 활용 할 수 있다. 대표적인 중심성 지표로는 연결 중심성(Degree Centrality), 매개 중심성(Betweenness Centrality), 근접 중심성 (Closeness Centrality) 등이 있다. 매개 중심성은 노드 간 최단 경로상에 특정 노드가 위치하는 빈도를 측정하여 정보 흐름 의 병목점을 식별하는 데 유리하며, 근접 중심성은 한 노드 에서 다른 모든 노드까지의 평균 거리를 기반으로 네트워크 내 접근성을 평가한다.

본 연구에서는 연결 중심성(Degree Centrality)을 주요 분석 지표로 채택하였다. 그 이유는 다음과 같다. 첫째, 본 연구의 목적이 '얼마나 많은 위험 시나리오에 특정 장비가 관여하는 가'를 정량화하는 것이므로, 직접 연결된 엣지의 수를 기반 으로 하는 연결 중심성이 물리적 의미와 가장 부합한다. 둘 째, 본 연구에서 구축한 네트워크는 Cause→Safeguard의 2계 층(Bipartite-like) 구조를 가지므로, 경로 기반 지표인 매개 중 심성이나 근접 중심성은 네트워크 토폴로지 특성상 해석의 유의미성이 제한적이다.

연결 중심성 C_D(v) 는 한 노드에 직접 연결된 엣지의 수 를 전체 노드 수로 정규화한 값으로, 수식은 다음과 같다.

C_{D} (v) = \frac{\deg (v)}{N - 1}

(1)

여기서 deg (v) 는 노드 v에 연결된 엣지의 수, N 은 전 체 노드수를 의미한다. deg (v) 는 인접 행렬(Adjacency Matrix)을 이용하여 다음과 같이 표현할 수 있다.

\deg (v) = \sum_{i = 1}^{N} A_{v j}

(2)

여기서 A_vj 는 인접 행렬의 요소로 노드 v 와 j가 연결 되어 있으면 1, 그렇지 않으면 0을 의미한다.

HAZOP 네트워크에서 특정 장비 노드의 연결 중심성이 높다는 것은, 해당 장비가 다수의 사고 시나리오에 원인 (Cause)으로 작용하거나, 여러 위험을 방어하는 핵심 방호장 치(Safeguard)로 기능함을 의미한다. 즉, 연결 중심성이 높은 노드는 시스템의 안전 무결성을 유지하기 위해 최우선으로 관리되어야 할 핵심 장비(Critical Node)로 해석될 수 있다.

3. 연구 대상 및 방법

3.1 연구방법론 개요

Fig. 1은 본 연구에서 제안하는 HAZOP 데이터 처리 및 위 험 네트워크 구축 절차를 나타낸다.

본 연구의 절차는 크게 네 단계로 구성된다. 첫째, 대상 설비에 대해 수행된 HAZOP 워크시트를 수집한다(3.2절). 둘 째, 정규표현식(Regex) 기반 전처리를 통해 워크시트 내 비 정형 장비 태그를 표준화한다(3.3절). 셋째, 표준화된 데이터 에서 Cause-Safeguard 간 인과관계를 추출하여 위험 지식그래 프를 구축한다(3.4절). 넷째, 구축된 네트워크에 대해 연결 중심성 분석을 수행하여 핵심 장비를 정량적으로 도출한다 (4장).

3.2 대상 설비 및 HAZOP 수행 개요

3.2.1 대상 설비

본 연구의 분석 대상은 (재)한국조선해양기자재연구원 (KOMERI)에 구축된 LNG 기자재 실증설비이다. 해당 설비는 LNG 연료/운반 선박의 핵심 기자재인 CTMS(Custody Transfer Measurement System), NG(Natural Gas) 유량계, 펌프, 기화기 등 의 성능 검증을 목적으로 구축되었으며, LNG 저장탱크 (T100, T200), 펌프(P300), 기화기(V400), 계측시스템(CT101), NG유량계(F501)로 구성되어 있으며 설비의 개략도는 Fig. 2 와 같다.

본 실증설비는 CTS 테스트, 유량계 테스트 등을 수행하기 위해 N₂ 퍼징(N₂ Purging), 쿨다운(Cool-down), LNG 충전 (LNG Filling) 등 다양한 운전 시나리오를 반복적으로 수행하 는 동적(Dynamic) 특성을 가진다.

3.2.2 HAZOP 수행 개요

본 연구에서는 해당 실증설비에 대해 2021년 7월 01~02일 수행된 HAZOP 워크숍 결과 보고서를 분석 데이터로 활용 하였다. 워크숍에는 Facilitator 1인, Scribe 1인, 설비 설계 담 당자 2인, 운전 담당자 2인, 개발 제품 담당자 7인 외 외부 전문가 4인 이 참여하였으며 2일간 약 16 시간에 걸쳐 수행 되었다. HAZOP 워크숍 수행 후 결과리포트가 작성되어 외 부전문가 2인에게 배포/검토하였고 이후 최종 보고서가 완 성되었다. HAZOP 워크시트는 IEC 61882에 의거하여 Node, Deviation, Cause, Consequence, Safeguard 등이 포함된 정형화된 형식으로 작성되었으며, 사용된 Parameter 는 Flow, Pressure, Temperature, Level 이며 Guide Word 는 More, Less, No, Reverse 이다. 주요 운전 조건은 LNG 펌프 운전 시 약 13 barg의 압 력과 −163℃ 내외의 극저온 환경을 포함한다.

분석 범위는 LNG Tank 구역과 LNG Pump & Vaporizer 구 역의 2개 영역으로 구분하였으며, 각 노드는 운전 모드에 따 라 Table 1과 같이 세분화하였다.

HAZOP 워크숍을 통해 총 418건의 원인(Cause)이 도출되었 으며, 이 중 원인이 식별된 유효 시나리오 392건을 연구에 활용하였다. 원인 미식별 26건은 HAZOP 워크시트상 "No cause identified"로 기록되어, Cause-Safeguard 간 인과관계를 구성할 수 없으므로 네트워크 분석 대상에서 제외하였다. 위험도 등급별 분포는 Table 2와 같다.

위험도는 ISO 17776 (ISO, 2016) 에 의거하여 워크숍 현장 에 참석한 전문가들의 브레인스토밍으로 결정되었으며 High risk가 0건인 것은 실증설비 설계 단계에서 안전장치가 충분 히 반영된 결과로, HAZOP을 통해 식별된 모든 시나리오가 기존 Safeguard 내에서 관리 가능한 수준임을 확인하였다.

3.3 정규표현식 기반 HAZOP 데이터 전처리 및 태그 표준화

HAZOP 워크시트는 워크숍 참여자의 주관적 표현이 포함 된 비정형 텍스트로 작성되어 있어, P&ID 상의 태그 번호 (Tag No.)와 워크시트 내 표기 간 불일치(Inconsistency)가 존 재한다. 본 연구에서는 정규표현식(Regular Expression, Regex) 을 활용한 규칙 기반(Rule-based) 데이터 전처리를 수행하여 이 문제를 해결하였다. 전처리는 두 단계로 구성된다.

* 1단계 – 태그 추출: Python 기반 전처리 모듈을 통해 워 크시트의 Cause 및 Safeguard 항목에서 장비 태그를 추출하였 다. 적용된 정규표현식 패턴은 다음과 같다.

[A - Z] \{2, 4\} [\ s \ -] ? \ d \{3\}

(3)

이 패턴은 "영문 대문자 2~4자 + 선택적 공백 또는 하이 픈 + 숫자 3자리"로 구성되며, HAZOP 워크시트에서 사용되 는 계측기기(PIT, LT, TT 등), 밸브(AV, MV, SV 등), 주요 장 비(CT, LP 등)의 태그 표기를 포괄적으로 매칭한다.

* 2단계 – 태그 정규화(Normalization): 추출된 태그에 포 함된 하이픈(-)과 공백을 제거하여, 표기 방식에 무관하게 동 일한 고유 장비 ID로 통일하였다. 본 패턴이 처리 가능한 변 형 유형 예시는 Table 3과 같다.

이 과정을 통해 워크시트 내 동일 장비의 이표기(異表記) 문제를 해소하고, 후속 네트워크 분석을 위한 데이터 간 연 결성을 확보하였다. 총 418개 분석 행에서 93종의 고유 장비 태그가 추출되었다.

다만, 본 연구에서 적용한 정규표현식 기반 접근법은 "영 문+숫자" 조합의 정형화된 장비 태그 패턴 추출에는 효과적 이나, 서술문 형태의 위험 기술(예: "LNG 이송 배관의 열팽 창에 의한 응력 발생")이나 비표준 약어 등 복잡한 자연어 표현의 처리에는 한계가 있다. 이러한 비정형 텍스트의 구 조화를 위해서는 NLP 기반 개체명 인식(NER) 등 고도화된 방법론이 요구되며, 이는 향후 연구 과제로 남겨둔다.

3.4 위험 네트워크 모델링

전처리된 데이터를 바탕으로, 설비의 위험 구조를 시각화 하기 위해 위험 지식그래프(Risk Knowledge Graph)를 구축하였 다. 그래프 구축에는 Python NetworkX 라이브러리를(Hagberg et al., 2008), 시각적 표현에는 Gephi(Bastian et al., 2009)를 활 용하였다.

그래프 모델의 구성 요소는 다음과 같이 정의하였다.

* 노드(Node): Cause 항목 및 Safeguard 항목에서 추출된 고 유 장비 ID를 노드로 정의하였다. 추출된 93종의 태그 중 Cause-Safeguard 간 인과관계가 성립하는 84종을 네트워크 노 드로 활용하였으며, 나머지 9종은 Cause 또는 Safeguard 어느 한쪽에만 단독 출현하여 엣지를 형성하지 못하므로 분석에 서 제외하였다.

* 엣지(Edge): 하나의 HAZOP 시나리오 행(Row)에서 Cause 항목에 등장한 장비 태그를 원인 노드(Source), 동일 행의 Safeguard 항목에 등장한 장비 태그를 방호조치 노드(Target) 로 설정하고, 이를 방향성 엣지(Directed Edge)로 연결하였다. 즉, 엣지의 방향은 "이 원인(Cause)에 대해 이 방호조치 (Safeguard)가 대응한다" 는 관계를 나타낸다. 하나의 시나리 오 행에 복수의 Cause 태그 또는 복수의 Safeguard 태그가 존 재할 경우, 가능한 모든 조합에 대해 엣지를 생성하였다.

예를 들어, 특정 시나리오에서 Cause에 "MV101 오조작"이, Safeguard에 "LT101 경보, PIT101 경보"가 기재된 경우, MV101→LT101 및 MV101→PIT101의 두 개 방향성 엣지가 생성된다.

이렇게 구축된 네트워크 모델은 텍스트 속에 산재된 장비 간 위험 대응 관계를 그래프 형태로 가시화하며, 4장에서 수 행할 연결 중심성 분석의 기초 데이터로 활용된다.

4. 연구 결과

4.1 데이터 전처리 결과

정규표현식 기반 전처리를 통해, HAZOP 워크시트 내 비 정형 텍스트에 산재해 있던 장비 태그를 표준화된 고유 ID("AA000" 형식)로 통합하였다. 총 418개 분석 행에서 93종 의 고유 장비 태그가 추출되었으며, 전처리 과정에서 해소 된 이표기(異表記) 사례는 총 4종(143건)으로, 모두 공백 포 함 유형(예: "AV 202"→"AV202", "PCV 301"→"PCV301", "PIT 001"→"PIT001", "SP 001"→"SP001")이었으며, 하이픈 포함 변 형은 발견되지 않았다. 이표기 전체 태그 출현 빈도 3,098건 대비 약 4.6%에 해당하였다. 이는 수작업 기반 HAZOP 워크 시트에서 표기 불일치가 무시할 수 없는 수준으로 존재함을 실증적으로 보여준다. 추출된 93종의 고유 장비 태그는 Table 4와 같다.

Cause 에서만 등장하는 태그는 51종, Safeguard 에서만 등 장하는 태그는 32종이며, 양쪽 모두 등장하는 태그는 총 10 종 이었다.

4.2 위험 네트워크 구축 결과

추출된 93종의 태그 중, Cause-Safeguard 간 인과관계가 성 립하는 84종을 네트워크 노드로 활용하였다. 구축된 위험 네 트워크는 84개 노드와 944개의 방향성 엣지로 구성되며, 엣 지의 방향은 원인 노드(Cause) → 방호조치 노드(Safeguard)로 설정되었다.

Fig. 3은 구축된 위험 네트워크 전체를 시각화한 것이다. 노드 크기는 연결 중심성(Degree Centrality)에 비례한다. 그래 프의 형태를 살펴보면, LT101, LT201, PIT101, PIT201 등 상위 계측 장비들이 네트워크 중심부에 대형 노드로 밀집되어 있 으며, 이들로부터 다수의 엣지가 방사형으로 연결되는 허브 -스포크(Hub-Spoke) 구조가 뚜렷하게 나타난다. 반면 외곽의 소형 노드들은 상대적으로 적은 수의 연결을 가지며, 이는 네트워크 전체가 소수의 고연결 노드에 연결이 집중되는 비균질(Heterogeneous) 구조를 가짐을 시각적으로 확인할 수 있다.

4.3 연결 중심성 분석 결과

T100의 레벨 트랜스미터인 LT101이 연결 중심성 0.7108(고 유 연결 노드 수 59, In=48, Out=11)로 가장 높은 수치를 기록 하였다. 그 뒤를 이어 T200에 대응하는 LT201(0.6988), 압력 트랜스미터 PIT001(0.6747), PIT101 및 PIT201(각 0.6506)이 상 위권을 차지하였다.

4.4 결과 고찰

구축된 네트워크의 기초 통계를 살펴보면, 네트워크 밀도 (Density)는 0.135로 가능한 연결의 13.5%만이 실제로 존재하 는 희소(Sparse) 구조를 나타낸다. 연결 중심성의 평균은 0.2701, 표준편차는 약 0.17이며, 최대값 0.7108(LT101)과 최소 값 0.0120(CV301) 간 약 59배의 격차를 보인다. 이러한 높은 분산은 소수의 핵심 계측 장비에 방호 기능이 구조적으로 집중되어 있음을 통계적으로 뒷받침하며, 4.2절에서 관찰된 허브-스포크 구조와 일관된 결과이다.

기존 HAZOP 워크시트에서는 각 시나리오가 개별 노드(운 전 모드) 단위로 분리되어 기록된다. 예를 들어 LT101이 9개 운전 모드 전체에 걸쳐 48종의 원인 장비에 대한 공통 방호 장치로 기능한다는 사실을 파악하려면 392건의 시나리오를 수동으로 교차 검토해야 한다. 본 연구의 네트워크 분석은 이러한 교차 검토를 자동화하고, 그 결과를 연결 중심성이 라는 단일 수치로 정량화함으로써, 전문가의 주관적 판단에 의존하지 않고도 장비 간 위험 구조를 객관적으로 파악할 수 있게 한다. 이는 기존 HAZOP이 "어떤 위험이 있는가"를 식별하는 데 그쳤다면, 본 연구는 "어떤 장비가 시스템 안전 에 가장 큰 영향을 미치는가"를 정량적으로 답한다는 점에 서 차별화된다.

4.4.1 LT101/LT201의 구조적 대칭성

상위 1, 2위를 차지한 LT101과 LT201은 각각 T100 및 T200 에 대응하는 독립된 계측 장비임에도 거의 동일한 중심성 수치를 보인다. 이는 두 탱크가 N₂ Purging, Cool Down, CTS Test, Flowmeter Test 등 모든 운전 모드에서 구조적으로 동일 한 위험 시나리오를 공유하며, LT101/LT201이 이 과정에서 반복적으로 공통 방호조치(Safeguard)로 참조되기 때문이다. LT101에 직접 연결된 원인 장비(Predecessor)가 총 48종에 달 한다는 사실은 이 장비가 설비 전반의 레벨 이상을 감지하 는 핵심 안전 계측 루프임을 데이터 기반으로 뒷받침한다.

4.4.2 PIT001의 3위 진입과 공용 계측 장비의 역할

PIT001은 설비 전체에 공급되는 N₂ 라인의 공용 압력 트 랜스미터로, 연결 중심성 0.6747(3위)을 기록하였다. 특히 이 장비는 In-degree 51, Out-degree 8로 방호조치(Safeguard)와 원 인(Cause) 양쪽에서 모두 높은 빈도로 등장하는 이중 역할 (Dual-role) 노드이다. In-degree가 높다는 것은 PIT001이 다수 의 위험 시나리오에서 방호 장치로 참조됨을 의미하며, 동 시에 Out-degree가 8이라는 것은 PIT001 자체의 고장이 8종의 다른 장비에 영향을 미치는 원인으로도 작용함을 나타낸다. 이러한 이중 역할 특성은 PIT001이 설비 안전 관리에서 특별 한 주의를 요하는 장비임을 시사한다.

4.4.3 CT101의 특이성 - 중심성 순위와 In 가중치의 괴리

실증설비의 핵심 시험 대상 장비인 CT101(CTMS)은 연결 중심성 기준 10위(0.5060)에 위치하나, In-degree Weighted Count 기준으로는 354를 기록하여 상위 10개 노드 중 LP304(376), LP305(376)에 이어 세 번째로 높은 값을 나타냈다. 이는 CT101 에 연결된 원인 장비의 종류(42종)는 상위 장비 대비 적지만, 각 원인 장비에서 CT101로 향하는 시나리오의 빈도가 압도 적으로 높다는 것을 의미한다. 즉, CT101은 다양한 운전 조 건에서 발생하는 위험 원인들의 최종적인 피영향 대상(End Receiver)이 되는 구조적 특성을 가지며, 이는 시험 설비 본 연의 성능 신뢰성과 직결되는 결과이다.

4.4.4 Out 노드수 0의 해석

Table 5에서 LG101, LG201, PIT301, PIT501, CT101의 Out-degree가 0이다. 이는 해당 장비가 HAZOP 워크시트에서 원인(Cause)으로는 한 번도 등장하지 않고, 오직 방호조치 (Safeguard)로만 참조되는 순수 방호장치임을 나타낸다. 전체 84개 노드 중 Out-degree가 0인 순수 방호장치는 23종으로, 이 러한 장비는 스스로 위험을 유발하지는 않으나, 고장 시 다 수의 시나리오가 동시에 방호 불능 상태에 놓이는 공통원인 고장(Common Cause Failure) 대상이 될 수 있다.

4.4.5 서브그래프를 통한 핵심 구조 확인

Fig. 4는 연결 중심성 상위 30개 노드만을 추출한 서브그 래프이다. 전체 노드의 36%에 해당하는 30개 노드와 이들 사이의 엣지 217개로 구성된다.

그래프 중심부에는 LT101, LT201이 가장 큰 노드로 위치 하며, PIT001, PIT101, PIT201, LG101, LG201 등 계측 장비군 이 밀집된 허브 구조를 형성하고 있다. 외곽에는 AV 계열 (AV101, AV201 등) 및 MV 계열(MV101, MV201 등) 밸브류가 소형 노드로 분포하며, 이들은 주로 원인(Cause)으로 작용하 여 중심부 계측 장비로 엣지가 집중되는 방사형 구조를 보 인다. 이는 밸브류의 오작동이나 부적절한 조작 발생 시, 중 심부 계측 장비에 위험이 집중적으로 전파될 수 있는 구조 임을 의미한다.

5. 결 론

본 연구에서는 LNG 기자재 실증설비의 실제 HAZOP 데이 터를 대상으로, 정규표현식 기반 데이터 전처리 및 위험 네 트워크 분석 프레임워크를 제안하고 적용하였다. 정규표현 식을 활용하여 비정형 워크시트 내 장비 태그의 비표준 표 기를 표준화하고, 이를 기반으로 위험 지식그래프(84노드, 944엣지)를 구축한 뒤 연결 중심성 분석을 수행한 결과, 레 벨 트랜스미터 LT101(C_D = 0.7108)을 비롯한 상위 계측 장 비군이 설비 전체 운전 모드에 걸쳐 공통 방호 기능을 수행 하는 핵심 노드임을 정량적으로 식별하였다.

본 연구의 기여와 시사점은 다음과 같다. 첫째, 비정형 텍 스트로만 존재하던 HAZOP 결과물을 컴퓨터가 처리 가능한 구조화된 데이터로 변환함으로써, 향후 유사 설비의 안전 분석에 재활용 가능한 데이터 기반을 마련하였다. 전처리 과정에서 4종의 이표기 패턴(143건, 전체 태그 출현 빈도의 4.6%)을 해소하여 데이터 간 연결성을 확보한 것은, 수작업 기반 HAZOP 워크시트에서 표기 불일치가 무시할 수 없는 수준으로 존재함을 실증적으로 보여준다. 둘째, 네트워크 연 결 중심성 분석을 통해, 개별 노드 분석으로는 식별하기 어 려운 방호 기능의 집중 구조를 정량적으로 가시화하였다. 특 히 상위 5개 핵심 장비(LT101, LT201, PIT001, PIT101, PIT201) 는 네트워크 평균 중심성(0.2701) 대비 2.41배 이상의 연결 중심성을 나타냈으며, 이는 해당 장비에 대해 일반 장비 대 비 강화된 예방 정비(PM) 주기 적용 및 2oo3 (2-out-of-3) 보팅 방식의 이중화 구성 또는 SIL(Safety Integrity Level) 등급 상향 조정을 우선 검토해야 할 정량적 근거가 된다. 다만, 이러한 제안은 네트워크 분석 결과에 기반한 방향성 제시로서, 실 제 적용을 위해서는 LOPA(Layer of Protection Analysis) 기반의 정량적 SIL 산정 및 비용-편익 분석 등 후속 연구를 통한 실 무적 검증이 수반되어야 한다. 셋째, 실증설비의 핵심 시험 대상인 CT101(CTMS)이 연결 중심성 10위임에도 In-degree Weighted Count 354를 기록하여, 연결된 장비의 종류는 적지 만 시나리오 집중도가 압도적으로 높은 최종 피영향 장비 (End Receiver)로서의 구조적 특성이 정량적으로 확인되었다.

본 연구는 연결 중심성 단일 지표에 기반하였으며, Consequence 항목을 네트워크에 포함하지 못한 한계가 있다. Consequence를 포함하지 못함으로써 위험의 최종 영향(화재, 누출, 동상 등)에 기반한 심각도 분석이 불가하며, 동일한 연 결 중심성을 가진 장비 간에도 실제 위험 영향도가 다를 수 있다는 점을 고려하지 못하였다. 향후 연구에서는 다음과 같은 방향으로 확장하고자 한다. 첫째, 본 연구에서 제안한 프레임워크를 차세대 친환경 연료 설비에 확장 적용할 계획 이다. 현재 암모니아 연료 기자재 실증설비가 구축 중이며, 2027년 완공 예정이다. 극저온 및 화재 위험 중심의 LNG와 달리 독성(Toxicity) 위험이 공존하는 암모니아 설비에 본 방 법론을 적용함으로써, 연료 특성에 따른 위험 네트워크 구 조의 차이를 비교 분석하고 차세대 선박 연료 인프라 전반 에 걸친 안전 분석 프레임워크로 확장하고자 한다. 둘째, 본 연구에서는 위험도 등급(Low, Medium)을 구분하지 않고 모 든 엣지를 동일하게 처리하였으나, 후속 연구에서는 위험도 등급을 엣지 가중치로 반영한 위험도 가중 중심성 (Risk-weighted Degree Centrality) 분석을 수행할 계획이다. 또 한 본 연구에서 전체 운전 모드를 합산하여 단일 네트워크 로 분석한 것을 준비 모드(N₂ Purging, Cool Down)와 시험 모드(CTS Test, Flowmeter Test)로 분리하여, 운전 단계별 핵심 장비의 변화를 비교 분석함으로써 운전 모드별 맞춤형 안전 관리 전략 수립에 기여하고자 한다. 셋째, 센서 데이터와의 실시간 연계를 통한 동적 위험 예측 시스템으로 발전시키 며, LOPA 기반 SIL 산정 알고리즘과의 통합을 통해 실무적 완성도를 높여갈 계획이다. 나아가 본 연구에서 구축한 구 조화된 데이터를 거대언어모델(LLM)의 도메인 특화 학습 데이터로 활용하여, 현장 엔지니어에게 즉각적인 안전 조치 를 제안하는 대화형 안전 가이드 시스템 구축의 기초 자료 로 발전시킬 수 있을 것으로 기대한다.

감사의 글

본 연구는 산업통상부와 한국산업기술평가관리원의 “친 환경선박전주기핵심기술개발(RS-2023-00285272_중대형 선박 용 암모니아 내연기관 개발 및 실증)” 과 “조선해양산업기술 개발사업(RS-2025-02633377_암모니아 연료추진선의 누출감 지, 처리 시스템 개발)”의 지원을 받아 수행된 연구결과임.

Figure

Fig. 1.

Research Methodology Flowchart.

Fig. 2.

Schematic Overview of the LNG Equipment Test Facility.

Fig. 3.

Risk Knowledge Graph (84 Nodes, 944 Edges).

Fig. 4.

Sub-graph of Top 30 Nodes (Degree Centrality).

Table

Table 1.

HAZOP Analysis Node Configuration

Scope	Node	Operation Mode
1. LNG Tank	1-1A	N2 purging (T100)
1-1B	N2 purging (T200)
1-2	Cool down and LNG filling
1-3	CTS test
2. LNG Pump & Vaporizer	2-1	N2 purging
2-2	cool down
2-3A	CTS test (T100)
2-3B	CTS test (T200)
2-4	Flowmeter Test

Table 2.

HAZOP Scenario Distribution by Risk Level

Node	Number of Scenarios by Risk Level
1-1A	32	1	33
1-1B	32	1	33
1-2	39	7	46
1-3	41	15	56
2-1	26	1	27
2-2	20	4	24
2-3A	47	10	57
2-3B	47	10	57
2-4	48	11	59
Total	332	60	392

Table 3.

Equipment Tag Normalization Examples

Original Notation	Extracted Result	Normalized ID	Equip.Type
PIT-301	PIT-301	PIT301	Pressure Transmitter
PIT 301	PIT 301	PIT301	Pressure Transmitter
PIT301	PIT301	PIT301	Pressure Transmitter
LT-101	LT-101	LT101	Level Transmitter
AV 201	AV 201	AV201	Actuated Valve

Table 4.

Distribution of Extracted Equipment Tags by Type

Equipment Type	Count	Example
Actuated Valve (AV)	14	AV101, AV201
Manual Valve (MV)	15	MV101, MV301
Pressure Transmitter (PIT)	7	PIT101, PIT301
Thermal Safety Valve (TSV)	8	TSV001, TSV301
Level Transmitter (LT)	4	LT101, LT201
ETC	45	CT101, PSVV101
Total	93	-

Table 5.

Degree Centrality Analysis Results for Top 10 Equipment Nodes

* N = 84 (전체 노드), C_D(v) = deg(v) / (N-1)

* deg(v): 방향 무관 고유 연결 노드 수

* In-degree Weighted Count : 해당 장비가 Safeguard로 기록 된 총 횟수 (중복 포함)

* LT000: Level Transmitter

* PIT000: Pressure Transmitter

* LG000: Level Gauge

* CT101: CTMS (Test Target)

Rank	Tag	deg(v)	In-Degree	Out-Degree	C_D(v)	In-degree Weighted Count
1	LT101	59	48	11	0.7108	340
2	LT201	58	48	10	0.6988	297
3	PIT001	56	51	8	0.6747	324
4	PIT101	54	52	3	0.6506	281
5	PIT201	54	52	3	0.6506	284
6	LG101	50	50	0	0.6024	301
7	LG201	50	50	0	0.6024	300
8	PIT301	46	46	0	0.5542	328
9	PIT501	45	45	0	0.5422	286
10	CT101	42	42	0	0.5060	354

Reference

Bastian, M., S. Heymann, and M. Jacomy ( 2009), Gephi: An open source software for exploring and manipulating networks, Proceedings of the Third International AAAI Conference on Weblogs and Social Media (ICWSM 2009), pp. 361-362.
Crawley, F. and B. Tyler ( 2015), HAZOP: Guide to Best Practice, 3rd ed., Elsevier, Amsterdam.
Dunjó, J., V. Fthenakis, J. A. Vílchez, and J. Arnaldos ( 2010), Hazard and operability (HAZOP) analysis. A literature review, Journal of Hazardous Materials, Vol. 173, No. 1-3, pp. 19-32.
Guo, S., D. Gao, D. Lu, and M. Wang ( 2025), HAZOP knowledge graph construction: Dual optimization of ontology design and information extraction, Journal of Loss Prevention in the Process Industries, Vol. 94, Article 105538.
Hagberg, A. A., D. A. Schult, and P. J. Swart ( 2008), Exploring network structure, dynamics, and function using NetworkX, Proceedings of the 7th Python in Science Conference (SciPy 2008), pp. 11-15.
IEC ( 2016), IEC 61882: Hazard and operability studies (HAZOP studies) - Application guide, International Electrotechnical Commission, Geneva, Switzerland.
ISO ( 2016), ISO 17776: Petroleum and natural gas industries - Offshore production installations - Guidelines on tools and techniques for hazard identification and risk assessment, International Organization for Standardization, Geneva, Switzerland.
Lee, D., T. Q. Quach, A. D. Nguyen, J. Park, Y. Bae, and Y. Kim ( 2025), Integrating LLM and Multioutput Logistic Regression for HAZOP Prediction, Journal of Hydrogen and New Energy, Vol. 36, No. 6, pp. 714-723.
Liu, C. and S. Yang ( 2022), Using text mining to establish knowledge graph from accident/incident reports in risk assessment, Expert Systems with Applications, Vol. 207, Article 117991.
Stamatis, D. H. ( 2003), Failure Mode and Effect Analysis: FMEA from Theory to Execution, 2nd ed., ASQ Quality Press, Milwaukee, WI.
Wang, Z., B. Zhang, and D. Gao ( 2022), A novel knowledge graph development for industry design: A case study on indirect coal liquefaction process, Computers in Industry, Vol. 139, Article 103647.
Zhao, Y., B. Zhang, and D. Gao ( 2022), Construction of petrochemical knowledge graph based on deep learning, Journal of Loss Prevention in the Process Industries, Vol. 76, Article 104736.

Node	Number of Scenarios by Risk Level
Node	Low	Medium	High	Total
1-1A	32	1	0	33
1-1B	32	1	0	33
1-2	39	7	0	46
1-3	41	15	0	56
2-1	26	1	0	27
2-2	20	4	0	24
2-3A	47	10	0	57
2-3B	47	10	0	57
2-4	48	11	0	59
Total	332	60	0	392