인공지능 챗봇 심심이, 최첨단 한국어 일상대화 AI 공공 데이터 구축 프로젝트 성공
인공지능 챗봇 심심이, 최첨단 한국어 일상대화 AI 공공 데이터 구축 프로젝트 성공
  • 이지연 기자
  • 승인 2022.12.29 13:50
  • 댓글 0
이 기사를 공유합니다

심심이 제공

인공지능(AI) 챗봇 '심심이(주)(대표 최정회)'는 한국어 대화형 AI 기술을 돕는 최첨단 데이터셋 구축을 최근 성공적으로 마쳤다고 29일 밝혔다.

'한국어 블렌더봇 데이터' 과제 주관사로서 구축 프로젝트를 순조롭게 마무리 한 심심이는 지난 11월 과학기술정보통신부(이하 과기부)가 주관하고 한국지능정보사회진흥원(이하 NIA)이 추진하는 '2022년도 인공지능 학습용 데이터 구축사업'에 참여했다.

지난해 '텍스트 윤리검증 데이터' 과제 주관사로서 심심이는 대화형 AI 윤리 검증을 돕는 데이터를 구축한 바 있으며, 올해 '한국어 블렌더봇 데이터’를 통해 대화형 AI 기술 수준을 높일 수 있는 공개 데이터 구축까지 진행했다.

심심이 관계자는 “지난 20년 동안 축적한 대화 AI 기술 및 데이터 노하우를 바탕으로 프로젝트 일정 준수와 데이터의 품질 두 마리 토끼를 모두 잡았다는 평가를 받고 있다”며, 또한, 프로젝트 외적으로도 다양한 활동을 통해 일상대화 AI 관련 풍부한 시너지를 창출했다는 평가도 이어졌다”고 전했다.

과제 내의 각 데이터들은 공개 전부터 주목받고 있다. 세부 데이터 중 하나인 “공감형 대화” 데이터와 연계하여 데이터 과학자들이 심심이 대화 데이터를 분석한 논문이 세계 최고 수준의 저널에 게재되는 한편 정신건강 의료 전문가와 챗봇 기반 디지털치료제 개발 협업을 시작할 수 있었으며, “지식검색 대화” 데이터는 데이터와 구축 방식에서 최근 돌풍을 일으키고 있는 ChatGPT의 학습 설계와 유사해 차세대 언어모델을 위한 프랙티스를 미리 쌓았다는 평가다.

심심이는 프로젝트 기간 중에도 지속적으로 일상대화 기술에 대한 조망을 놓치지 않았다. 인공지능신문, 한국인공지능협회와 함께 학계, 연구소, 현업의 대화형 AI 전문가 10여 명을 인터뷰하며 대화형 AI와 일상대화 기술, 데이터에 대해 홍보하고 미래를 조망하는 시리즈를 게재했다. 이를 통해 대형 언어모델과 관련된 다양한 수요와 고민을 청취할 수 있었고 다자간 협업 가능성을 모색했다.

심심이 최정회 대표는 "이번 과제의 성공적인 수행은 심심이가 일상대화 데이터에 능숙하기 때문이라는 의견이 있지만 이와 더불어 NIA의 탄탄한 구축 체계, 자문위원단 등 외부 전문가들의 관심과 성원, 참여 기관들의 헌신적인 노력이 시너지를 일으킨 결과"라며 "공공에 기여하려는 목적이 컸지만 거꾸로 얻은 것이 훨씬 더 많다”고 말했다.

이어 “우리 과제의 3개 데이터가 도움을 주는 영역 즉 사실 기반 대화, 페르소나 유지, 공감 능력은 최근 큰 관심을 끌고 있는 ChatGPT 등 대화형 AI가 여전히 풀어야 할 문제점들을 해결하는데 꼭 필요한 데이터인 만큼 남아 있는 품질 검증과 내년 하반기 쯤으로 예상되는 공개 후 지원까지 빈틈없이 제공함으로써 한국어 일상대화 AI 발전을 위해 노력할 것"이라고 덧붙였다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.