본문 바로가기

Research

딥러닝을 위한 기상 예측 데이터셋으로 과기부장관상 수상기

SI-Analytics에는 위성영상을 활용한 다양한 연구가 진행되고 있습니다. 
올해에는 기상 위성 데이터와 그 외 다양한 기상 관측 데이터를 확보하여 기상 분야에 딥러닝을 적용한 연구도 수행할 수 있었습니다.

다양한 연구 성과들이 있지만 그중에서도 저희가 생산한 데이터셋을 공유하고자 출전한 "2020 연구데이터·AI 분석활용 경진대회(과학기술정보통신부 주최, KISTI 주관)"에서 최우수상인 과학기술부장관상을 수상하는 뜻깊은 일이 있었습니다.

 

http://www.dataon-con.kr/index.php

 

SI-Analytics와 SI에서는 4명의 연구자(최예지, 백민영, 최형욱, 차금강)가 함께 SIAin(사이어인)이라는 팀으로 출전하여 "강수량 예측을 위한 시계열 관측 통합 데이터 Radar-AWS-IMERG Network Fusion"를 제안하였습니다. 
강수량 예측을 위해서 딥러닝 커뮤니티도 여러 연구들을 활발하게 진행하고 있고, 올해 구글에서도 MetNET을 개발하여 미국 해양대기청의 수치 예보 모델보다 더 좋은 성능을 보였다고 발표한 바 있습니다. 이러한 딥러닝 기반의 강수량 예측을 위해서는 강수와 관련된 다양한 자료를 활용하는 것이 중요합니다. 저희는 다양한 강수 관련 관측 자료를 함께 분석할 수 있도록 RAIN-F를 제안하였습니다. RAIN-F를 생산하기 위해 활용한 데이터는 레이더, 지상 관측, 위성(IMERG) 자료입니다. 

레이더는 전파를 대기 중으로 발사하여 비, 눈, 우박 등 대기중 강수 입자에 부딪혀 돌아오는 산란 신호의 특성을 이용하여 강수를 관측하는데 가장 기본이 되는 자료로 활용되고 있습니다. 지상 관측은 600개 이상의 AWS와 ASOS 지점에서 제공하고 있는 기상 변수(기온, 습도, 기압, 풍향, 풍속 등) 자료이며, IMERG는 마이크로파 위성 관측 자료로 마이크로파를 이용하여 강수 구름에 있는 물방울, 얼음 입자의 물리적 정보를 얻을 수 있어 강수 산출에 가장 중요한 관측 센서로 알려져 있습니다.

 

기상 정보는 기본적으로 날씨 예측을 위해 사용되지만 사회, 경제 등 다양한 분야에서 활용할 수 있습니다. 날씨와 관련된 상품의 판매량 예측, 유통 과정 중 날씨에 의한 장애 및 지연 예측, 농축산 분야 경영 리스크 및 경영 예측 등 다방면에 도움이 될 정보로 활용될 수 있기 때문입니다. 이와 같은 RAIN-F의 활용 가능성이 저희가 장관상을 수상하는데 큰 기여를 한 것 같습니다.

기상 자료는 대부분 공공 데이터로 자료의 출처만 밝히면 누구나 사용할 수 있게 많이 공개되어 있어서 대기과학 분야 연구자들뿐만 아니라 데이터를 필요로 하는 많은 딥러닝 연구자들에게 좋은 연구 재료가 될 수 있습니다. 하지만, 자료마다 특징, 형식, 구조가 다르기 때문에 어느 정도의 도메인 지식이 필요하고, 방대한 양의 자료를 처리하기 위해서는 시간도 많이 드는 것이 현실입니다. 이런 현실의 벽을 극복하기 위해 딥러닝 연구자와 도메인 연구자 사이의 협력도 매우 중요하지만, 각 응용 분야 연구에서 활용할 수 있는 벤치마크 데이터셋이 공유되어 연구에 활용할 수 있도록 하는 것도 중요합니다. 저희가 제안한 RAIN-F는 이러한 벽을 허물고 기상 자료를 활용한 딥러닝 연구를 확장하는데 기여할 수 있을 것이라 기대합니다. 

저희가 제안한 RAIN-F 데이터셋은 KISTI의 연구 데이터 공유 플랫폼을 통해 공유될 예정입니다. 관련 내용은 추후에 업데이트하도록 하겠습니다. 

 


[##최예지##]