본문 바로가기

전체 글

세상에서 가장 간단한 Airflow 튜토리얼 머신 러닝 파이프라인의 필요성 일반적으로 학계에서 딥 러닝을 연구한 연구자들은 잘 정제되어 있는 벤치마크 데이터셋에서 명확한 평가 지표를 갖고, 성능을 향상시키기 위한 모델 개선을 고민하는 데에 익숙합니다. 하지만 이러한 연구자들이 현실의 문제를 해결하기 위해 Wild Environment에 발을 내딛으면 여러 종류의 애로사항에 직면합니다. 정제되어 있는 데이터셋은 없으며, 주기적으로 라벨이 수정되거나 새로운 데이터가 끊임 없이 계속 쌓입니다. 그때마다 새로 학습 데이터셋을 구성해야 하며, 평가 데이터셋 또한 주기적으로 업데이트해야 할 것입니다. 또한, 좀 더 유저 경험을 고려한 새로운 평가 지표를 개발해야 하며, 때로는 단일 모델만 사용하는 게 아니라 여러 개의 모델과 연동하기 위해 각각의 모델을 위한.. 더보기
위성 영상 이해하기 그리고 딥러닝 part 3. 위성 영상의 종류와 영상의 파라미터들을 알아보았고 이번 글에서는 위성 영상에 적용되는 전처리 과정에 대해 알아보겠습니다. 위성 영상은 일반 카메라로 찍은 영상과 달리, 사람의 눈으로 인지할 수 있는 가시광선 파장 영역뿐만 아니라, 적외선 영역, 마이크로파 영역 등 다양한 파장 영역의 영상을 얻을 수 있습니다. 일반적으로 흔히 볼 수 있는 위성 영상은 정사각형 형태의 grid로 이루어져 있으며 영상 자체의 위쪽이 북쪽을 가리키는 방향으로 정렬되어 있습니다. 지표에서 반사된 태양에너지가 위성의 관측 센서로 들어오면, 센서 내부에서 감지된 빛의 밝기가 하나의 픽셀로 저장되며 각각의 독립적인 밝기 값을 가진 픽셀들이 조합되어 연속적인 명암을 가진 하나의 영상으로 구성됩니다. 이렇게 획득된 자료는 일반 사진과 달.. 더보기
위성 영상 이해하기 그리고 딥러닝 part 2. 이전 글에서는 위성 영상의 종류에 대해서 알아 봤다면, 이번 글에서는 위성 영상이 어떻게 구성되며 어떤 기준으로 영상의 품질을 확인하는지 적어보도록 하겠습니다. 위성 영상의 파라미터 중 가장 중요하다고 볼 수 있는 resolution은 아래와 같이 네 가지로 정의될 수 있습니다. Spatial Resolution (공간 해상도) Spectral Resolution (분광 해상도) Temporal Resolution (시간 해상도) Radiometric Resolution (방사 해상도) Spatial resoution(공간 해상도)은 쉽게 말해 얼마나 작고 가까이 있는 물체까지 자세하게 관측할 수 있는가를 나타내는 지표입니다. 이는 센서의 특성과 위성에서 물체까지의 거리에 따라 결정됩니다. 공간 해상도는.. 더보기
위성 영상 이해하기 그리고 딥러닝 part 1. SI-Analytics는 인류가 지구 관측을 통해 미래의 현명한 결정을 하기 위한 가치 제공이라는 미션과, 인공지능 기반 위성/항공 영상 분석 전문 기업이 되기 위한 비전을 가지고 있습니다. 그렇다면 위성 영상이란 어떤 것 일까요? 카카오맵? 구글어스? 인공위성에서 찍은 영상? 지구를 넓은 범위에서 관측할 수 있는 영상? 그렇다면 구름이 낀 날은 어떻게 하지? 밤에는? 이런 다양한 생각들이 떠오를 것으로 예상됩니다. 이 포스팅에서는 저희가 연구 대상으로 삼고 있는 위성 영상에 대해 간단히 설명하며 여기서 어떻게 딥러닝이 적용될 수 있는지 알아보고자 합니다. 먼저, 위성 영상은 크게 Passive 영상과 Active 영상으로 구분할 수 있습니다. Passive 센서는 물체가 자체적으로 발산하는 에너지를 관.. 더보기
Score-based Generative Modeling by Diffusion Process Introduction to Score-based Generative Models Generative Model는 현실에 존재할만한 그럴듯한(High-fidelity) 이미지를 만들거나, Semi-supervised Learning, Few-Shot Learning 등의 문제에서 성능을 향상시키거나, 적대적 예제나 이상치 탐지를 하는 데 이용하는 등 다양한 응용 문제들에 활용될 수 있습니다. 대표적인 예로 흔히들 잘 알려져 있는 Autoencoder, VAE, GAN, Normalizing Flows를 들 수 있을 것입니다. 이번 글에서는 이와는 다른 방법론인 Score-based Generative Modeling에 대해서 다뤄보도록 하겠습니다. 이 글에서 주로 다룰 논문은 아래와 같습니다. Gener.. 더보기
[슬기로운 인턴생활] SIA 개발팀 인턴편 (2/2) 이전 글 살펴보기 Q. 짧은 시간이었지만 인턴을 하시면서 개발자로서 어떤 걸 얻으신 것 같나요? 유림: 처음에 UI 가이드라인 문서와 프로토타입을 보고 이걸 어떻게 개발하나 걱정이 많았죠. 하지만 여러 시행착오 끝에 걱정에 비해 잘 개발해낸 것 같아서 좋았어요. 동근: 데일리 미팅 때마다 내가 일한 것과 일할 것을 다같이 공유해요. 할 수 있는 분량을 정해서 말해야 하는데, 매일 하다 보니 연습이 되면서 제 한계를 정확하게 파악할 수 있었어요. 빈: 맡은 작업을 어떻게든 끝마쳤을 때, 그때가 정말 보람 있었어요. 그리고 테스터분들이 발견해 주신 버그가 생각보다 없었을 때 내심 뿌듯했죠. Q. 회사에 어떤 기여를 한 것 같다고 생각하시나요? 빈: 잔업무를 해드리면서 일손을 보태드리지 않았나 싶어요. 유림:.. 더보기
[슬기로운 인턴생활] SIA 개발팀 인턴편 (1/2) 고양이 세수로 졸린 얼굴을 대강 씻어내고, 수면 잠옷을 입은 채 커피 한 잔을 내려 책상에 앉는다. (세수와 커피는 선택 사항이다) 한 손으로 노트북 전원을 켜며 다른 한 손으로 재빠르게 출퇴근 관리 앱의 출근하기 버튼을 연속해서 누른다. 이내 '오늘도 힘찬 하루 되세요!' 메시지와 함께 오늘의 일과가 시작된다. 일명 ‘코시국’으로 인해 먼 미래 같았던 집에서 출근하기가 생활화된 요즘. 우리 회사 역시 팀 전체 인원의 30% 비율로 재택근무를 시행하고 있습니다. 코로나 시국의 인턴 생활은 어떨지 궁금하지 않으신가요? 코끝이 시려오는 작년 12월 어느 날, 개발팀 인턴십을 진행했던 세 분을 모시고 그간의 이야기를 들어보았습니다. Q. 안녕하세요! 먼저 간단한 자기소개 부탁드려요. 빈: 개발팀에서 프론트엔드.. 더보기
딥러닝을 위한 기상 예측 데이터셋으로 과기부장관상 수상기 SI-Analytics에는 위성영상을 활용한 다양한 연구가 진행되고 있습니다. 올해에는 기상 위성 데이터와 그 외 다양한 기상 관측 데이터를 확보하여 기상 분야에 딥러닝을 적용한 연구도 수행할 수 있었습니다. 다양한 연구 성과들이 있지만 그중에서도 저희가 생산한 데이터셋을 공유하고자 출전한 "2020 연구데이터·AI 분석활용 경진대회(과학기술정보통신부 주최, KISTI 주관)"에서 최우수상인 과학기술부장관상을 수상하는 뜻깊은 일이 있었습니다. SI-Analytics와 SI에서는 4명의 연구자(최예지, 백민영, 최형욱, 차금강)가 함께 SIAin(사이어인)이라는 팀으로 출전하여 "강수량 예측을 위한 시계열 관측 통합 데이터 Radar-AWS-IMERG Network Fusion"를 제안하였습니다. 강수량 .. 더보기