AI-modellen Seamless M4T bygger på Metas ramverk Massively Multilingual Speech,som tillhandahåller teknik för taligenkänning, språkidentifiering och talsyntes på mer än 1 100 språk, rapporterar Techcrunch.
Modellen översätter på begäran och ”gör det möjligt för människor som talar olika språk att kommunicera mer effektivt”, skriver Meta i ett blogginlägg.
”SeamlessM4T känner implicit igen källspråken utan att det behövs en separat språkidentifieringsmodell”, står det i inlägget.
Totalt klarar modellen att översätta och transkribera nära 100 språk både i tal och text.
För att skapa modellen har Meta skrapat offentligt tillgänglig text i storleksordningen ”tiotals miljarder” meningar och fyra miljoner timmar tal från webben. De har sedan anpassat 443 000 timmar tal med texter och skapat 29 000 timmar av tal-till-tal-anpassningar.