연구목적
앱스토어나 플레이스토어를 들어가면 넘치는 것이 “앱(App)”이다. 그렇다면 정보소외계층들은 과연 편리한 앱이 부족해서 사용을 하지 못하는 것일까? 있는데 못 찾는 것은 아닐까? 본 연구는 이러한 의문에서 시작된다. 한국갤럽과 와이즈앱이 각각 실시한 조사에 따르면 정보소외계층의 주 연령대인 50대 이상의 스마트폰 사용률은 증가하는 추세이다. 그러나 이들이 대부분 사용하는 앱은 유튜브 네이버, 다음, 카카오톡이다. 즉, 스마트폰 사용에 대한 거부감은 없는데 더 편리한 삶, 더 건강하고 안전한 삶을 영위하는데 도움을 줄 앱이 있다는 것을 알지 못해서, 또는 사용법을 알지 못해서 활용하지 못하고 있다고 유추할 수 있다.
따라서 본 연구에서는 나에게 필요한 앱을 맞춤형으로 추천해줄 수 있는 AI 모델을 구축하여 정보소외계층들이 본인에게 필요한 앱을 쉽게 찾은 후 사용법까지 편리하게 알 수 있도록 하고자 한다. 이미 “필수 어플 가이드”처럼 필요한 앱을 유형화하여 추천해주는 어플리케이션이 있지만 이마저도 정보소외계층들이 조작하기 어려워 보였다. 그리하여 대화만으로 인덴트를 찾아 적절한 앱을 추천해주는 모델을 구축하여 정보소외계층들 또한 고도화된 디지털환경의 장점을 함께 누릴 수 있도록 한다.
연구방법
먼저 Google Play store에서 정보를 크롤링한다. 크롤링한 자료에는 앱이름, 카테고리, 다 운로드 수, 가격, 앱 정보가 포함되어 있다. 크롤링한 자료에서 App과 Translated_Review열 만 뽑아낸다. 단어집합생성을 진행하기 위해 string자료형인 App과 Translated_Review를 str 자료형으로 변환한다. 이후 토크나이징을 진행하여 데이터 전처리 작업을 완료한다. 이때 question을 Translated_Review로 answer로 설정한다. 다음으로 전처리한 자료를 Transformer 모델을 이용하여 학습시킨다. 이러한 과정을 거쳐 구현한 AI모델에 발화자의 대화를 input으로 넣어 테스트하여 적절한 앱을 추천하여주는지 확인할 예정이다.
또한 팀 역량 발현을 최대화하며 연구를 진행하기 위해 본 팀은 각 팀원의 경력과 관심사를 고려하여 역할을 안배하였다. 인공지능과 딥러닝을 공부하고있 오예림 팀장은 팀의 계획을 총괄하며 다양항 아이디어가 인공지능으로 구현이 가능한지 판단하고 가능하다면 딥러닝을 활용해서 데모를 실행하였다. 데모의 실행과 인공지능으로의 구현은 두경민 팀원 또한 함께 하였는데 AI에 대한 관심과 카카오뱅크에서 근무했었던 경험을 바탕으로 기획했던 모델이 인공지능으로 구현되는데까지 많은 역할을 수행하였다. 마지막으로 김연중 팀원은 국회에서의 교육·문화·사회 분야 자문과 폐자원 관리 스타트업 및 전략컨설팅 펌에서 근무했던 경험을 바탕으로 사회문제에 대한 진단과 아이디어 및 모델 기획을 담당하였다.
연구결과 및 성과품
연구결과에 대한 간략한 도식은 위와 같다. 구글 플레이스토어 데이터를 크롤링하여 앱의 리 뷰를 독립변수, 앱 이름을 종속변수로 하는 데이터를 수집한 후 모델에 맞게 전처리한다. 이 렇게 전처리한 데이터로 Transformer model을 Pretraining 후, finetunig한다. 이렇게 학습 한 모델은 화자의 발화를 input값으로 넣어주면 화자의 인덴트를 적절하게 파악하여 적절한 앱을 매칭시켜 추천하여준다. 직접 실행해본 결과 아래와 같이 “I want user friendly host!” 라는 input 값을 넣었더니 이 화자의 인덴트를 파악하여 “Hopper – Watch & Book Flights” 라는 여행 앱을 추천한 것을 확인할 수 있는 걸로 보아 적절하게 학습이 완료된 모델이라는 것을 파악가능하다. 현재는 데이터의 크기 때문에 영어 텍스트를 기반으로 학습시켰지만 추가 평가자료에 한국어 리뷰데이터 크롤링 코드를 넣어주었다. 해당 코드를 통해 영어 데이터셋과 같은 데이터를 만든 후 이를 통해 같은 방법으로 학습시키면 한국어 버전 추천 모델도 쉽게 만들 수 있다.
기대효과
디지털 환경에 익숙한 2030대비 절반 수준인 정보소외계층의 디지털정보화 수준을 상승시키는 동시에 이들의 어플리케이션의 사용성 문제를 개선하여 고도화된 디지털 환경의 혜택을 함께 누릴 것으로 예상된다. 또한 최종적으로 이를 통한 정보소외계층의 삶의 질 향상을 기대하고 있다. 이러한 어플리케이션의 AI 맞춤형 서비스를 통해 모든 디지털 컨텐츠의 접근성에 공공성을 갖추며 근본적으로는 정보소외계층이 발생하지 않도록 노력하고자 한다. 코로나19의 영향으로 비대면 정보화 능력이 현대사회에서 더더욱 삶의 필수요건이 되어 가고 있다. 따라서 본 서비스를 통해서 디지털소외계층들이 지능정보사회 속에서 소외감 없이 더불어 살아가는 사회의 초석이 되기를 바라마지 않는다.
코드 및 데모
깃 링크 해당 깃러브에 readme로 코드 설명을 달아뒀습니다.