GeoAI는 공간정보과학(Geospatial Science; Spatial Data Science)과 인공지능(Artificial Intelligence)의 합성어이며, 공간 빅데이터(Spatial Big Data)로부터 유의미한 정보를 도출하기 위해 인공지능 기술(A.I.: Machine Learning, Deep Learning)과 고성능 컴퓨터를 활용하는 분야로써, 이 글은 항공영상으로부터 탐지하고자 하는 객체를 자동으로 획득하는 GeoAI의 한가지 기술 개발을 위해 직접 학습 DB를 구축하고, 실제 딥러닝 학습을 통한 도출된 모델을 이용하여 테스트한 내용을 소개합니다.
항공영상으로부터 탐지하고자 하는 객체는 건물과 비닐하우스로 정하고, 이 두가지에 대한 학습 DB인 레이블 데이터를 구축하고, 구축된 학습 데이터를 이용해 Detection에 대한 신경망 모델인 Faster R-CNN을 학습시켰습니다. 구축 건수는 건물와 비닐하우스에 대해 각각 6000개, 2000개이고, 레이블 데이터 구축 툴은 아래의 글에서 소개한 GeoAI Labeling Tool입니다.
총 35 Epoch만큼 학습된 모델을 이용해 항공영상을 테스트했으며, 그 중 테스트한 순서대로 3개정도의 이미지만을 언급하면 다음과 같습니다. 참고로 Class1은 건물, Class2는 비닐하우스입니다.
모델 성능 검증을 위해 소량의 데이터와 작은 반복의 학습했으므로, 높은 정확도를 기대한 것은 아니지만, 소량의 학습 DB임에도 상당수의 건물(Class1) 또는 비닐하우스(Class2)에 대해서 종류별로 검출이 되는 것을 볼 수 있습니다. 하지만 3번째 이미지를 보시면, 좌상단 부분의 건물 몇개가 검출되지 않는 결과를 볼 수 있습니다.
해서, 3번 이미지 중 검출되지 않는 부분만을 짤라내어 다시 검출을 시도해 보면 다음처럼 검출되는 것을 볼 수 있었습니다.
실제 프로젝트에서는 더 많은 수의 학습 데이터를 구축하고, 이를 다시 데이터 증강기법을 이용한 보강을 통해 더욱 높은 포퍼먼스를 얻을 수 있습니다. 또한 Faster R-CNN 보다는 항공영상에서의 건물 등과 같은 객체 탐지를 위한 더 나은 모델을 활용하는 것이 옳을 것입니다. 즉, Faster R-CNN처럼 먼저 영역(Region)을 추출하고, 이 영역에 대한 분류(Classification)을 수행하는 방식이 아닌, 픽셀 단위로 바로 분류 하는 모델이 정확성과 업무의 응용성이 더 높을 것입니다. 물론 Faster R-CNN의 장점은 정확한 학습 DB를 빠르게 구축할 수 있다는 장점이 있으므로 적용하고자 하는 분야에 따라 신경망 모델을 결정해야 할 것입니다. 아울러 학습 DB 구축에 대해 덧붙이자면 건물이나 비닐하우스 등은 지역과 계절에 따라 그 형상 및 색감이 다르므로 계절별로, 또 보다 더 넓은 지역을 범위로 해야 합니다.