제목 | 군의 인터넷 언론대응 및 관리를 위한 방위사업 관련 문서분류 모델 개발 |
---|---|
작성자 | 관리자 |
내용 |
최근 증가한 인터넷 신문의 보급과 자동추천 알고리즘의 발달은 인터넷 사용자가 대상에 대한 판단을 할 때 실체와 다르게 볼 뿐만 아니라 이를 정정할 가능성을 차단한다. 군의 이미지 역시 대부분 인터넷을 통해 형성되고 있기 때문에 군의 이미지 관리를 위해서는 인터넷 신문과 사용자에 대해 적절하게 대응하는 것이 중요하다. 기존의 종이 신문에 비하여 인터넷 신문이 가지는 특징 중 하나는 높은 생산성과 파급속도인데, 이 때문에 부정적인 기사가 생산되면 급속히 퍼져나가고, 부정적인 이미지가 형성되고 나면 회복이 어렵다. 따라서 이미지를 관리하기 위해서 군은 인터넷 언론 중 대응 및 관리가 필요한 기사를 신속하게 분류하고 관련 부서에 전달하여 적절하게 대응하는 것이 필요하다.선행연구 검토 결과, 군에서는 긍정적인 이미지를 형성하기 위한 이미지 관리가 조직의 사기와 정책적 의사결정의 추진력을 위해서 중요하다는 점을 인식하고 있었으며, 이미지의 관리란 인터넷 언론과 사용자의 증가가 이루어지는 오늘날, 제3자가 인터넷 정보를 통해 만들어지는 이미지인 디지털 정체성의 관리를 의미하였다. 또한 부정적인 이미지가 형성되지 않도록 디지털 정체성을 관리하기 위해서는 긍정적이거나 중립적인 성향의 기사보다는 부정적인 성향의 기사를 비교적 더 주목해야 하는데 이를 위해서는 기사, 즉 자연어가 가지고 있는 긍정, 중립, 부정의 태도를 분석하는 감성분석 기법 중 하나인 극성분석이 필요하였다. 감성분석과 극성분석에 대한 연구는 트위터나 영화리뷰 등 일반적인 문장에 대한 연구는 활발하게 이루어졌지만, 군과 방위사업과 관련한 글, 특히 기사 분서에 관한 연구는 전무 한 수준이었다. 또한, 분류된 기사들은 대응부서로 분류하기 위해서는 각 대응부서별 수행하는 업무 등을 기준으로 문서를 분류해주는 문서분류 기법이 필요하였다. 문서분류에 대한 연구 역시 다양한 분야에서 연구되었지만, 군과 방위사업에 관한 데이터를 활용한 연구는 없었으며, 극성분석과 문서분류 모델을 동시적으로 분석한 연구 역시 확인되지 않았다. 또한 대부분의 연구 역시 분류 정확도를 높이는 것에 연구의 중점을 두었기 때문에 실무에서 관리하는 데이터의 적절성을 검토한 내용은 부족하였다. 따라서 본 연구에서는 방위사업과 관련된 디지털 정체성을 관리하기 위해 인터넷 기사 중 어떠한 내용의 기사들을 관리하여야 하는지에 대한 분류 및 기사 대응에 적합한 부서를 분류하기 위한 모델을 개발하고자 한다. 이를 위해 실제 방위사업청 대변인실에서 담당자가 수집하여 관리하고 있는 ’16년~’22년 방위사업청 관련기사 2,153건을 활용하였다. 그리고 이를 원본 데이터, 원본 데이터를 딥러닝에 적합하게 정제한 데이터, 정제한 데이터의 수량을 증강한 증강 정제 데이터, 정제한 데이터를 다시 분류한 재라벨 데이터로 나누어 실험을 진행하였다. 그 결과 방위사업과 관련된 기사 중 27.6%가 보다 관리에 중점을 두어야 하는 부정적인 성격을 가지고 있는 것으로 나타났다. 또한, 분류 정확도에 있어서는 원본 데이터가 50.1%, 정제된 데이터가 60.7%, 증강 정제 데이터가 60.3%, 재라벨 데이터가 70.7%로 나타났다. 실증연구를 통해, 인공지능 학습에 적합한 데이터로 정제하고 라벨링하여 관리하는 것이 문서분류 모델의 성능향상에 도움이 된다는 것과 현재 실무에서 관리하고 있는 데이터 관리방법은 일부 개선이 필요하다는 결론을 도출할 수 있었다. 본 연구에서는 감성분석 시 한국어 감성사전의 적용이 제한되었고, 기준 데이터를 대변인실에서 제공받은 기사로 활용하였기 때문에 기사의 성향별 명확한 기준을 수립하여 라벨링 하였을 때 성능확인은 할 수 없었다. 이는 추후 감성사전의 구축과, 방위사업 관련 기사분류의 기준을 제시하는 연구를 통해 극복할 수 있을 것으로 판단된다. |
첨부파일 | 장상훈.pdf |