Collecte de corpus : Méthode et application

Dans ce cours, je présenterai une méthode innovante pour collecter des corpus de parole, utilisant une application mobile, LigAikuma.

LigAikuma est une application pour smarthpones et tablettes facilitant la récolte de données langagières sur le terrain.

C’est un dispositif léger permettant de réaliser des collectes de parole dans un objectif technologique (développement de services vocaux pour les langues peu dotées) ou de documentation (pour les langues en danger).

LigAikuma propose 6 modes (Enregistrement, Respeaking, Traduction, Élicitation, Correction et Partage) et est disponible sous licence AGPL. L’application a déjà permis de collecter plus de 250h de parole dans 6 langues différentes d’Afrique sub-saharienne (dont 3 langues orales menacées et en cours de documentation).

Ce cours présentera un tutoriel sur les modes d’utilisation de LigAikuma ainsi que des retours d’expérience sur les collectes réalisées précédemment.

PDF du cours

PDF