빅데이터공통기반플랫폼,여섯번째이야기~혜안으로 떠나는 여행! 혜안뉴스!

4. 협업분석 우수사례 – 미세먼지, 빅데이터로 예측한다.

1 2 3 4

[ 4. 협업분석 우수사례 – 미세먼지, 빅데이터로 예측한다. ]국가정보자원관리원은 UN 글로벌 펄스 자카르타 연구소와 함께 '동북아 지역의 미세먼지 예측 및 주요 요인'을 데이터에 기반하여 분석하였습니다. 이번 분석에는 '15.1월부터 '18.3월까지의 인천 지역 미세먼지·대기오염 데이터, 미국항공우주국에서 제공하는 동북아 지역의 위성 센서 데이터 및 에어로넷의 지상 관측 센서 데이터를 활용하였습니다.

분석결과 미세먼지가 나쁨일 경우 풍향은 서풍이 불며 산동성, 산시성, 베이징, 허베이성 등 중국 지역의 에어로졸 농도가 매우 높다는 것을 확인할 수 있었습니다. 또한, 인천지역 20개 관측소의 미세먼지 예측 연관성을 비교한 결과, 인천 도심 지역이 아닌 백령도 지역의 미세먼지 및 이산화질소가 가장 높은 연관성을 보였습니다. 이는 국내 요인보다 국외 요인이 상대적으로 높음을 보여주는 결과입니다.

이번 분석은 미세먼지 예보의 최적 성능을 보인 그래디언트 부스팅* 기반의 예측모델을 구현하였으며, 이를 통해 2018년 1분기를 예측한 결과 미세먼지는 84.4%, 초미세먼지는 77.8%의 정확도를 보였습니다. 이는 기존 국내 미세먼지 예보보다 정확도가 15% 증가한 수치입니다.
* 약한 예측 모델을 결합하여 예측도를 향상시키는 기계 학습 모델

관리원은 좀 더 정확한 예측을 위해 에어로졸 분석 성능이 뛰어난 국내 정지 위성 데이터를 추가로 확보하고, 다른 분석모델과 결합해 예측 정확도를 높일 계획입니다.

김명희 국가정보자원관리원장은 "이번 분석은 국민의 생존권과 직결되는 미세먼지 문제를 빅데이터로 접근한 아주 의미 있는 사례"이며, "사회적 가치가 높은 분석과제를 지속적으로 수행하여 정부정책에 대한 국민의 신뢰를 얻고 국민의 삶이 개선되도록 노력할 계획"이라고 밝혔습니다.

미세먼지 예측모델
예보 등급별 베이징·허베이성 센서 데이터 분포 예보 등급별 백령도 일산화탄소 데이터 분포

맨위로