교육 및 학습 분야 오픈DB 구축…자사 정오답 예측 알고리즘까지 오픈소스로 제공

[아이티데일리] 뤼이드(대표 장영준)는 교육 분야 인공지능(AI) 학습 데이터베이스(DB) ‘에드넷(EdNet)’을 구축하고, 수년간 축적해온 1억 건 이상의 문제풀이 및 학습 데이터를 공개한다고 2일 밝혔다.

뤼이드 AI 연구진은 최근 글로벌 논문 공유사이트 아카이브(arXiv)에 ‘에드넷’과 그에 담긴 데이터에 대한 내용을 담은 논문(EdNet: A Large-Scale Hierarchical Dataset in Education)을 공개했다.

‘에드넷’은 불특정 사용자들의 ▲문제 데이터 정보 ▲정오답 ▲풀이 소요 시간 ▲유저별 목표 점수 및 실제 점수 ▲강의 구매 시점 등 다양한 학습행동 데이터를 담은 개방형 DB다. 데이터와 함께 수집 과정, 처리 방법 등을 함께 제공해 데이터의 유효성을 입증하고 이해도를 높였다.

뤼이드는 지난 2017년부터 자사 AI 학습 솔루션 ‘산타토익’을 통해 약 78만 사용자에 대한 1억3천만 건 이상의 학습행동 데이터를 축적해왔다. 이번 ‘에드넷’ 구축으로 해당 데이터를 공개해, 누구든 대량의 학습행동 데이터를 내려 받아 정·오답 예측 및 추천 등의 AI 모델을 개발하는데 활용할 수 있도록 지원한다.

향후 뤼이드는 ‘에드넷’에 지속적으로 추가 데이터를 공개하고 다양한 교육 AI 분야 과제에 대한 알고리즘 개발 콘테스트를 개최한다. 이를 통해 교육 AI 시장에 대한 관심을 제고하고 더 많은 우수 인력이 진입할 수 있도록 유도해 시장을 시키겠다는 전략이다.

장영준 뤼이드 대표는 “교육 분야에서의 AI 연구는 금융, 의료 등 다른 산업에 비해 여전히 진공상태”라며, “보수적인 업계 특성상 디지털화된 데이터가 거의 없다는 것이 가장 큰 이유인데, 뤼이드가 이를 선제적으로 해결해 산업 전체의 AI 혁명을 주도하겠다”고 말했다.

한편 뤼이드는 딥러닝 모델 ‘트랜스포머(Transformer)’를 기반으로 개발한 자사의 정오답 예측 모델 알고리즘을 오픈소스로 공개한다. 누구나 해당 모델이 어떻게 프로그래밍 돼있는지 확인하고 정확도나 유효성을 실험해 볼 수 있다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지