Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1229-3431(Print)
ISSN : 2287-3341(Online)
Journal of the Korean Society of Marine Environment and Safety Vol.31 No.5 pp.658-664
DOI : https://doi.org/10.7837/kosomes.2025.31.5.658

Machine Learning-Based Estimation of Ship Main Engine Power Using AIS Data

Sang-Lok Yoo*, Deuk-Jae Cho**, Young-Hoon Yang**
*Professor, Department of Artificial Intelligence, Jeonju University, Jeonju, 55069, Korea
**Principal researcher, Korea Research Institute of Ships & Ocean Engineering, Daejeon, 34103, Korea

* First Author : sanglokyoo@jj.ac.kr


Corresponding Author : yhyang@kriso.re.kr, 042-866-3651
September 1, 2025 October 13, 2025 October 28, 2025

Abstract


Amid the decarbonization of international shipping and tightening of regulations under the International Maritime Organization Greenhouse Gas (IMO GHG) strategy, precise vessel-level emission estimation is required. However, automatic identification system (AIS) messages lack gross tonnage and main engine power, which increases reliance on external databases and induces error accumulation in indirect inference. To address this limitation, we estimate main engine power directly from the AIS static attributes by using ship length as the input in training type-specific machine-learning models. We compared eight algorithms—linear regression, K-nearest neighbors (KNN), random forest, gradient boosting, AdaBoost, extreme gradient boosting (XGBoost), light gradient boosting machine regressor (LightGBM), and categorical boosting (CatBoost). For each ship type, the dataset was randomly split; 10-fold cross-validation was performed on the 90% training data, and final performance was evaluated on the 10% holdout test set. On the test set, CatBoost yielded the highest R-squared for cargo ships (R²=0.96), gradient boosting for tankers (R²=0.96), XGBoost for passenger ships (R²=0.89), and CatBoost for towing ships (R²=0.76). These results show that the proposed approach reduces reliance on external databases and avoids the error accumulation inherent to two-step indirect estimation (length → gross tonnage → power), thereby enabling direct estimation of main engine power from AIS.



AIS 데이터를 이용한 기계학습 기반 선박 주기관 출력 추정

유상록*, 조득재**, 양영훈**
*전주대학교 인공지능학과 교수
**선박해양플랜트연구소 책임연구원

초록


국제해운의 탈탄소 전환과 IMO GHG 전략에 따른 규제 강화로 선박별 정밀 배출 산정이 요구되고 있다. 그러나 실제 운항 선 박의 주기관 출력 정보는 외부 데이터베이스에 의존하는 경우가 많아 데이터 수집 단계에서 상당한 경제적 비용과 시간 지연이 발생한 다. 이러한 제약을 완화하기 위해, 본 연구는 AIS 정적 정보 중 선체길이를 단일 입력변수로 활용하여 선종별 주기관 출력을 기계학습으 로 추정하는 방법을 제안한다. 본 연구에서는 선형회귀, K-최근접이웃, 랜덤포레스트, 그래디언트부스팅, AdaBoost, XGBoost, LightGBM, CatBoost 등 8종의 기계학습 모델을 적용하였다. 수집한 데이터는 선종별로 분리한 뒤 무작위 분할하였고, 90% 학습셋에서 10-fold 교차검 증을 수행한 후 10% 홀드아웃 테스트로 최종 성능을 평가하였다. 테스트셋 기준 화물선은 CatBoost가 R²=0.96, 탱커선은 Gradient Boosting이 R²=0.96으로 가장 우수하였다. 여객선은 XGBoost가 R²=0.89, 예인선은 CatBoost가 R²=0.76을 보였다. 본 연구를 통해 AIS 데이터를 이용하여 주기관 출력을 추정할 수 있음을 확인하였다.



    1. 서 론

    국제해운의 탈탄소 전환은 2023년 IMO GHG 전략의 채택 으로 한층 가속화되었다. 이 전략은 2030년까지 탄소배출량 을 2008년 대비 최소 40% 감축과, 2050년 무렵 국제해운 전 반의 순배출 제로 달성을 공동 목표로 제시하고 있다(Joung et al., 2020;MEPC, 2023). 이에 따라 CII·EEXI 등 단기·중기 규제가 단계적으로 강화되고 있으며, 실제 운항 조건을 반 영한 정밀한 산정 체계가 필수로 대두되고 있다.

    이산화탄소 또는 배기가스 배출량은 선박종류, 기관출력, 운항거리, 정박시간 등의 다양한 요인에 의해 결정된다. 이 러한 배출량 추정은 연료소비량 기반의 탑다운(Top-down) 방 식이 주로 사용되어 왔다. 그러나 이러한 접근법은 개별 선 박의 운항특성과 실시간 활동데이터를 반영하지 못하는 한 계를 가지고 있다. 반면, 보텀업(Bottom-up) 방식은 선박의 실 제 운항데이터를 기반으로 하여 보다 정확하고 세분화된 배 출량 산정이 가능하다는 장점이 있다.

    선박 주기관 출력 추정에 관한 선행연구를 살펴보면, Lee and Lee(2018)Choi et al.(2021)은 국내 주요 항만의 배기가 스를 산출하기 위해 선종별 발전기 평균 출력을 이용하였 다. 그러나 평균 출력을 사용할 경우 개별 선박의 고유한 특 성을 반영하지 못하여 추정 정확도에 한계가 있다. Lee and Lee(2019)은 부산항 선박 배기가스 배출량 산정을 위해 총톤 수 정보를 활용한 주기관 출력 추정방법을 적용하였으나, 구체적인 추정기법에 대한 상세한 설명은 제시하지 않았다. Weng et al.(2020)은 중국 양쯔강에서 선박 배출량 산정을 위 해 총톤수 정보를 이용하여 멱함수(power function) 회귀분석 으로 주기관 출력을 추정하였다. 그러나 선박자동식별장치 (Automatic Identification System, AIS) 데이터에는 총톤수 정보 가 포함되어 있지 않아, 별도의 외부 데이터베이스와 연계 하여 매칭해야 하는 추가적인 과정이 필요하다는 한계가 있 다. Gan et al.(2022)는 AIS를 이용한 중국 선전항의 선박 배출 량 산정 연구에서 선박길이를 멱함수 회귀분석으로 총톤수 를 추정한 후, 추정된 총톤수를 다시 활용하여 주기관 출력 을 추정하는 2단계 간접 추정방법을 적용하였다. 이러한 방 식은 선박길이→총톤수→주기관 출력의 2단계 추정과정을 거치면서 오차가 누적될 가능성이 높다. Kim and Dang(2020)Kim et al.(2022)는 광양항 입항 선박의 배기가스 배출량 산정을 위해 외부 웹 사이트로부터 주기관 출력 정보를 확 보하여 적용하였다. 그러나 외부 웹사이트에서 제공하는 주 기관 출력 정보는 일부 선박에 대해서만 제한적으로 제공되 어, 누락된 선박들의 출력 정보는 결국 별도의 추정이 불가 피한 한계가 있다.

    AIS는 선박 종류, 크기, 위치, 속도 등의 운항정보를 제공 하여 보텀업 방식의 배출량 산정에 필수적인 활동데이터를 제공한다. 그러나 AIS에는 배출량 산정에 핵심적인 총톤수 및 주기관 출력 정보가 포함되어 있지 않아, 이를 별도로 추 정하거나 연계해야 하는 문제가 존재한다. 따라서 본 연구 는 AIS 정적정보인 선박길이를 입력변수로 활용하여, 일반 화물선, 탱커선, 예인선, 여객선 등 선종별로 기계학습 기반 주기관 출력 추정모델을 개발하고자 한다. 이를 통해 외부 데이터 의존성을 최소화하고, 직접 추정방식으로 오차 누적 을 방지하며, 선종별 특성을 반영한 정확도 높은 주기관 출 력 추정이 가능할 것으로 기대된다.

    2. 연구방법

    2.1 자료 수집

    본 연구에서는 주기관 출력 정보를 확보하기 위해 한국선 원복지고용센터의 선박조회 시스템에서 공개된 데이터(선박 명, 총톤수, 기관출력, 선종)를 웹 크롤링으로 수집하였다. 해당 시스템에는 선박길이 정보가 포함되어 있지 않아, 해 양수산부에서 제공하는 선박등록현황 데이터인 선박명 및 총톤수를 매칭키로 활용하여 선박길이 정보를 추가로 확보 하였다. 또한 국내 항만에 입항한 외항선의 주기관 출력 정 보는 선박정보 전문업체인 VesselFinder의 유료 데이터베이스 를 활용하여 추가 수집하였다. VesselFinder에서는 선종, 선박 길이, 주기관 출력, 프로펠러 개수 등의 데이터 필드를 확보 하였으며, 선박길이나 주기관 출력 등 핵심 정보가 결측된 선박은 분석에서 제외하였다.

    2.2 데이터 전처리

    수집된 선박은 총 2,470척으로 다양한 선종이 포함되어 있다. 분석의 효율성을 위해 선종을 4개의 주요 범주로 분류 하였다. 첫째, 화물선은 석탄운반선, 광석운반선, 코일전용 선, 시멘트운반선, 원목운반선, 컨테이너선, 모래운반선, 산 물선 등을 포함하여 858척이다. 둘째, 탱커선은 케미칼운반 선, 석유제품운반선, 원유운반선, 급유선, LNG운반선, LPG운 반선 등을 포함하여 812척이다. 셋째, 여객선은 국내 연안여 객선과 중국 및 일본을 운항하는 외항여객선을 포함하여 184척이다. 넷째, 예인선은 압항예선, 접안용 예선, 견인용 예선 등을 포함하여 616척이다.

    2.3 기계학습 모델링

    본 연구는 선박의 주기관 출력을 예측하기 위해, 선박 길 이를 입력변수로 하고, 실제 출력을 종속변수로 하는 지도 학습 파이프라인을 구축하였다.

    각 선종별로 데이터를 90:10 비율로 분할하여, 90%는 10-fold 교차검증에 활용하고, 10%는 최종 성능 평가를 위한 홀드아웃 테스트셋으로 구성하였다. 적용한 기계학습 알고 리즘은 선형회귀(Linear Regression), K-최근접이웃(KNN), 랜덤 포레스트(Random Forest), 그래디언트부스팅(Gradient Boosting), AdaBoost, XGBoost, LightGBM, CatBoost 총 8개 모델이다 (Freund and Schapire, 1997;Breiman, 2001;Friedman, 2001;Chen and Guestrin, 2016;Ke et al., 2017;Prokhorenkova et al., 2018). 각 기본 모델에 대해 베이지안 최적화(Bayesian Optimization) 를 수행하여 하이퍼파라미터를 최적화하였다(Snoek et al., 2012).

    성능 지표로는 RMSE(Root Mean Squared Error)와 R²(결정계 수)를 활용하여 예측 정확도와 설명력을 균형있게 평가한 후, 각 선종별 최적 모델을 선정하였다

    3. 연구결과

    3.1 화물선

    Fig. 1은 수집한 858척의 화물선에 대한 선박 길이 분포를 상자그림으로 나타낸 것이다. 중앙값(Median)은 약 127.6m, 평균(Mean)은 137.8m이다. 제1사분위수(Q1)는 84.9m, 제3사분 위수(Q3)는 189.0m이며, 이에 따른 사분위범위 (IQR)는 104.1m이다. 즉, 전체 표본의 50%가 84.9~189.0m 구간에 분포 한다. 극단값은 없으며, 최대값은 약 328.5m, 최소값은 17.5m 이다.

    Table 1은 화물선 데이터셋에 대해 학습 데이터의 90%로 수행한 10-fold 교차검증과 나머지 10% 홀드아웃 테스트셋의 성능을 요약한 것이다. 테스트셋 기준 CatBoost 모델이 RMSE가 1,715.3으로 가장 낮고, R²는 0.96으로 높아 가장 우 수하였으며, Gradient Boosting과 Random Forest도 양호한 일반 화 성능을 보였다. 최적 CatBoost 모델의 주요 하이퍼파라미 터는 트리 깊이 5, L2 정규화 계수 2로 설정되었다.

    Fig. 2는 화물선 테스트셋에 대해 CatBoost 모델이 예측한 주기관 출력(세로축)과 실제 값(가로축)의 대응관계를 산점 도로 나타낸 것이다. 붉은 점선은 이상적인 1:1 관계선(y=x) 으로, 전반적으로 이 선을 중심으로 분포하여 일치도가 높 음을 보여준다.

    3.2 탱커선

    Fig. 3은 수집한 812척의 탱커선에 대한 선박 길이 분포를 상자그림으로 나타낸 것이다. 중앙값은 약 160.0m, 평균은 171.4m이다. 제1사분위수(Q1)는 86.6m, 제3사분위수(Q3)는 250m이며, 이 구간에 전체 탱커선의 50%가 포함된다. 극단 값 없으며, 최대값은 340m, 최소값은 20.2m이다.

    Table 2는 탱커선의 성능을 요약한 것이다. 테스트셋 기준 Gradient Boosting 모델이 RMSE가 1,799.9로 가장 낮고, R²는 0.96으로 가장 우수하였으며, Random Forest와 XGBoost, LightGBM, CatBoost, KNN도 R²이 동등하여 양호한 일반화 성 능을 보였다. 최적 Gradient Boosting 모델의 주요 하이퍼파라 미터는 최대 트리 깊이 5, 말단 노드 최소 표본 수 5, 최소 분할 표본 수 8로 설정되었다.

    Fig. 4는 탱커선 테스트셋에 대해 Gradient Boosting 모델이 예측한 주기관 출력과 실제 값의 대응관계를 나타낸 것이 다. 전반적으로 붉은 점선을 중심으로 분포하여 일치도가 높음을 보여준다.

    3.3 여객선

    Fig. 5는 수집한 184척의 여객선에 대한 선박 길이 분포이 다. 중앙값은 약 43.9m, 평균은 62.5m이다. 제1사분위수(Q1) 는 37m, 제3사분위수(Q3)는 57.5m이며, 이 구간에 전체 여객 선의 50%가 포함된다. 극단값은 제주로 가는 연안여객선 및 중국으로 가는 국제여객선으로 길이 130m 이상의 대형여객 선이다.

    Table 3은 여객선의 성능을 요약한 것이다. AdaBoost와 LightGBM 모델이 테스트셋 기준 R²는 0.91로 높을 값을 보였 으나, 10-fold 교차검증의 R²는 0.27~0.28로 매우 낮게 나타나 일반화 성능이 부족하였다. 따라서 10-fold 교차검증에서 양 호한 성능을 보인 XGBoost를 최종 모델로 선정하였다. XGBoost 모델의 주요 하이퍼파라미터는 최대 트리 깊이 10, 최소 자식 가중치2로 설정되었다.

    Fig. 6은 여객선 테스트셋에 대해 XGBoost 모델이 예측한 주기관 출력과 실제 값의 산점도를 나타낸 것이다. 중소형 여객선은 전반적으로 붉은 점선을 중심으로 분포하여 일치 도가 높으며, 일부 대형 여객선의 고출력 추정에 오차 분산 이 존재한다.

    3.4 예인선

    Fig. 7은 수집한 616척의 예인선에 대한 선박 길이 분포이 다. 중앙값은 약 28.2m, 평균은 28.6m이다. 제1사분위수(Q1) 는 24.4m, 제3사분위수(Q3)는 33.4m이며, 이 구간에 전체 예 인선의 50%가 포함된다. 최대값은 약 62.9m, 최소값은 13.4m 이다.

    Table 4는 예인선 데이터셋에 대해 학습 데이터의 90%로 수행한 10-fold 교차검증과 나머지 10% 홀드아웃 테스트셋의 성능을 요약한 것이다. 테스트셋 기준 CatBoost 모델이 RMSE가 598.9로 가장 낮고, R²는 0.76으로 가장 우수하였다. CatBoost 모델의 주요 하이퍼파라미터는 트리 깊이 7, L2 정 규화 계수 7로 설정되었다.

    Fig. 8은 예인선 테스트셋에 대해 CatBoost 모델이 예측한 주기관 출력과 실제 값을 산점도로 나타낸 것이다. 예인선 은 상대적으로 화물선, 탱커선, 여객선에 비해 주기관 출력 의 오차 분산이 큰 것으로 나타났다.

    4. 고 찰

    본 연구에서 선종별 최적 기계학습 알고리즘이 상이하게 나타난 것은, 각 알고리즘의 특성이 선종별 데이터 분포 및 샘플 크기와 상호작용한 결과로 판단된다. 화물선은 소형 연안 화물선부터 대형 벌크선까지 다양한 선형을 포함하여 데이터 분포가 불규칙하고 고출력 구간의 변동성이 크다. CatBoost는 과적합을 효과적으로 방지하고 불규칙한 패턴 학 습에 강건하여, 이러한 복잡한 데이터 특성에 효과적으로 대응할 수 있었던 것으로 판단된다(Prokhorenkova et al., 2018). 탱커선은 액체 화물 운반 특성상 선형 설계가 표준화 되어 있고, 선박 길이와 출력 간 관계가 비교적 선형적이고 일관된 패턴을 보인다. Gradient Boosting은 순차적으로 오차 를 줄여가며 일관된 패턴을 효과적으로 학습할 수 있어, 탱 커선의 균질적 데이터 특성에 적합했던 것으로 판단된다 (Friedman, J. H., 2001). 여객선은 표본 수가 184척으로 작고, 소형 연안여객선부터 대형 국제여객선까지 데이터 범위가 넓어 과적합 위험이 높다. XGBoost는 L1 및 L2 정규화 기능 이 강력하여 적은 샘플에서도 안정적인 예측 성능을 유지할 수 있었으며, 이는 여객선 데이터의 높은 분산을 효과적으 로 제어하는 데 적합했던 것으로 판단된다(Chen and Guestrin, 2016). 예인선은 항만 작업용 예선과 견인 작업용 예인선을 포함하여 출력 변동이 상대적으로 크다. 여러 알고리즘이 유사한 성능을 보였으나 CatBoost는 최소한의 하이퍼파라미 터 조정만으로 강건한 예측 성능을 보여, 본 선종에서 효율 적인 선택이었던 것으로 판단된다(Prokhorenkova et al., 2018).

    5. 결 론

    본 연구는 AIS 선박길이를 활용해 기계학습 모델 기반의 선종별 주기관 출력을 추정하였다. 각 선종별 데이터에 대 해 10-fold 교차검증과 홀드아웃 테스트를 병행하여 성능을 비교한 결과, 화물선은 CatBoost, 탱커선은 Gradient Boosting, 여객선은 XGBoost를 최종 채택하였다. 예인선은 CatBoost가 우수한 성능을 보였다. 본 연구를 통해 외부 데이터베이스 매칭에 대한 의존성으로부터 벗어나고, 길이→총톤수→출력 의 2단계 간접추정이 초래하는 오차 누적 문제를 줄이고, 직 접 추정이 가능함을 시사한다.

    본 연구에서 수집된 데이터는 총 2,470척으로 각 선종별 로는 화물선 858척, 탱커선 812척, 여객선 184척, 예인선 616 척으로 구성되었다. 그러나 전 세계적으로 운항되는 선박의 수를 고려할 때 상대적으로 제한된 표본 크기이므로 모델의 일반화 성능에 제약이 있을 수 있다. 또한 본 연구는 국내 항만에 입출항하는 선박 데이터에 기반하고 있어, 전 세계 다양한 해역에서 운항하는 선박에 대한 일반화에는 한계가 있을 수 있다.

    본 연구는 AIS 정적정보 중 선박길이만을 단일 입력변수 로 활용하였다. 이는 외부 데이터베이스에 대한 의존성을 최소화하려는 목적에는 부합하지만, 선박의 다양한 물리적 특성을 충분히 반영하지 못하는 한계가 있다. 주기관 출력 은 선박길이뿐만 아니라 선폭, 형심, 총톤수 등 다양한 선형 요소와 건조 연도, 제조사, 용도별 설계 특성에 따라 주기관 출력에 상당한 차이가 발생할 수 있으나, 본 연구에서는 이 러한 요인들을 고려하지 못하였다.

    향후 고출력 구간 표본을 추가 수집하고 입력변수를 선박 길이 외에 선폭·형심 등으로 확장하면, 모델의 일반화 성능 이 개선되고 정확도 역시 향상될 것으로 기대된다. 또한 본 연구에서 제안한 직접 추정 방식과 선박길이→총톤수→출 력으로 이어지는 2단계 간접 추정 방식을 RMSE와 R²로 정 량 비교하여 직접 추정의 우수성을 실증적으로 검증할 필요 가 있다.

    사 사

    본 논문은 해양수산부 재원으로 선박해양플랜트연구소의 기본사업인 “디지털서비스 플랫폼 및 다목적 항해계획 최적 화, 연안선박 탄소배출 모니터링 기술개발(PES5581)”에 의해 수행되었습니다.

    Figure

    KOSOMES-31-5-658_F1.jpg

    Boxplot of cargo ship length.

    KOSOMES-31-5-658_F2.jpg

    Actual vs. predicted main-engine power for cargo ships.

    KOSOMES-31-5-658_F3.jpg

    Boxplot of tanker ship length.

    KOSOMES-31-5-658_F4.jpg

    Actual vs. predicted main-engine power for tanker ships.

    KOSOMES-31-5-658_F5.jpg

    Boxplot of passenger ship length.

    KOSOMES-31-5-658_F6.jpg

    Actual vs. predicted main-engine power for passenger ships.

    KOSOMES-31-5-658_F7.jpg

    Boxplot of towing ship length.

    KOSOMES-31-5-658_F8.jpg

    Actual vs. predicted main-engine power for towing ships.

    Table

    Machine-learning results for estimating main-engine power of cargo ships.

    Machine-learning results for estimating main-engine power of tanker ships.

    Machine-learning results for estimating main-engine power of passenger ships

    Machine-learning results for estimating main-engine power of towing ships.

    Reference

    1. Breiman, L. ( 2001), Random forests, Machine Learning, Vol. 45, No. 1, pp. 5-32.
    2. Chen, T. and C. Guestrin ( 2016), XGBoost: A scalable tree boosting system, In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, pp. 785-794.
    3. Choi, J. K., M. Y. Kim, H. J. Lee, T. S. Kang, and K. W. Lee ( 2021), Estimation of Atmospheric Pollutant Emissions from Vessels in Major Harbor Cities in Korea and related Social Cost, Journal of the Korean Society of Marine Environment & Safety, Vol. 27, No. 7, pp. 905-917.
    4. Freund, Y. and R. E. Schapire ( 1997), A decision-theoretic generalization of on-line learning and an application to boosting, Journal of Computer and System Sciences, Vol. 55, No. 1, pp. 119-139.
    5. Friedman, J. H. ( 2001), Greedy function approximation: a gradient boosting machine, Annals of Statistics, Vol. 29, No. 5, pp. 1189-1232.
    6. Gan, L., W. Che, M. Zhou, C. Zhou, Y. Zheng, L. Zhang, and L. Song ( 2022), Ship exhaust emission estimation and analysis using Automatic Identification System data: The west area of Shenzhen port, China, as a case study, Ocean & Coastal Management, Vol. 226, pp. 1-14.
    7. Joung, T. H., S. G. Kang, J. K. Lee, and J. Ahn ( 2020), The IMO initial strategy for reducing Greenhouse Gas (GHG) emissions, and its follow-up actions towards 2050, Journal of International Maritime Safety, Environmental Affairs, and Shipping, Vol. 4 No. 1, pp. 1-7.
    8. Ke, G., Q. Meng, T. Finley, T. Wang, W. Chen, W. Ma, and T. Y. Liu ( 2017), Lightgbm: A highly efficient gradient boosting decision tree, Advances in Neural Information Processing Systems, Vol. 30. pp. 1-9.
    9. Kim, H. Y. and B. H. Dang ( 2020), Estimation of Ship Emission based on Data of Ship’s In and Out of Port, Journal of Korean Institute of Intelligent Systems, Vol. 30, No. 6, pp. 453-458.
    10. Kim, H. Y., B. H. Dang, and S. S. Hong ( 2022), Estimation of air pollution from ships in port area: a case study of Yeosu and Gwangyang ports in Korea, Atmosphere, Vol. 13, No. 11, pp. 1-17.
    11. Lee, M. W. and H. S. Lee ( 2018), A Study on Atmospheric Dispersion Pattern of Ship Emissions - Focusing on Port of Busan, Journal of Korea Port Economic Association, Vol. 34, No. 1, pp. 35-50.
    12. Lee, B, K. and S. M. Lee ( 2019), Current Status of Ship Emissions and Reduction of Emissions According to RSZ in the Busan North Port, Journal of the Korean Society of Marine Environment and Safety, Vol. 25, No. 5, pp. 572-580.
    13. MEPC ( 2023), IMO Strategy on Reduction of GHG Emissions from Ships.
    14. Prokhorenkova, L., G. Gusev, A. Vorobev, A. V. Dorogush, and A. Gulin ( 2018), CatBoost: unbiased boosting with categorical features. Advances in Neural Information Processing Systems, Vol. 31. pp. 1-11.
    15. Snoek, J., H. Larochelle, and R. P. Adams ( 2012), Practical bayesian optimization of machine learning algorithms, Advances in Neural Information Processing Systems, Vol. 25. pp. 1-9.
    16. Weng, J., K. Shi, X. Gan, G. Li, and Z. Huang ( 2020), Ship emission estimation with high spatial-temporal resolution in the Yangtze River estuary using AIS data, Journal of Cleaner Production, Vol. 248. pp. 1-14.