2018년 3월 뉴스레터
혜안뉴스 (빅데이터분석과 분석우수사례)

1 2 3 4 5 6

인공지능을 활용한 임장일지 유사사건 여죄분석


절도사건은 발생빈도가 높고 범행수법이 다양해 피의자의 여죄를 찾아내는데 현실적으로 어려움이 많고, 실제로
미제사건 비율이 70%에 달하고 있습니다. 이런 문제를 해결하기 위해 동일범 여죄판단 수사 등에 임장일지*
빅데이터 분석을 활용하여 미제사건을 해결하고, 민생치안을 강화하기 위해 국가정보자원관리원과 경찰청이
협력하였습니다.

*임장일지 : 사건의 개요 및 범행수법 등이 상세하게 기술된 일지

국가정보자원관리원은 검거된 피의자의 임장일지와 상황·수법이 유사한 미제사건의 임장일지를 찾아내기 위해

기존 알고리즘(TFIDF, Binary 벡터, 토픽모델링)과 구글 최신 알고리즘(Doc2Vec)의 문서 유사도 측정 알고리즘을
활용했습니다.

문서 유사도 측정에 적합한 알고리즘 도출을 위해 이미 해결 된 임장일지를 검증데이터로 활용해 반복적인 테스트를 진행하였고, 약 1만여 건의 동의어와 약 7백 건의 불용어 사전을 자체 개발해 분석모델 최적화에 성공했습니다.

기존 알고리즘(TFIDF, Binary 벡터, 토픽모델링)과 구글 최신 알고리즘(Doc2Vec)의 문서 유사도 측정 알고리즘





임장일지를 바탕으로 구현된 분석 모델은 부산지방경찰청의 범죄피의자 여죄추적에 활용되어 3건의 추가 여죄가 입증되었고, 타 지역의 유사사건(6건)에 대한 수사가 진행 중입니다. 경찰청은 범죄분석시스템(SCAS)에 국가정보자원관리원이 제공한 '임장일지 기반의 빅데이터 여죄추적' 기능을 구현하여 과학적 범죄수사에 활용할 계획입니다.

범죄분석시스템(SCAS) 임장일지 기반의 빅데이터 여죄추적