Omnilingual ASR est une technologie de pointe qui permet la reconnaissance vocale dans un large éventail de langues, allant de dizaines à plus de 1 600. En utilisant des techniques avancées telles que l'auto-supervision de style wav2vec et des décodeurs améliorés par LLM, elle combine plusieurs ensembles de données pour fournir une reconnaissance vocale précise et efficace. Ce système est conçu pour être accessible tant pour les langues à faibles ressources que pour celles à fortes ressources, ce qui en fait une avancée significative dans le domaine de la reconnaissance automatique de la parole.