Meta запускає нову програму в партнерстві з ЮНЕСКО для збору записів промов і транскрипцій, яка, за словами компанії, допоможе розробці майбутнього відкритого ШІ.
Програма, Партнерська програма з мовних технологій , шукає співавторів, які можуть надати понад 10 годин записів мови з транскрипціями, великою кількістю письмового тексту та наборами перекладених речень «різноманітними мовами». За словами Meta, партнери працюватимуть із командами AI компанії, щоб інтегрувати ці мови в моделі розпізнавання мовлення та перекладу AI, які — після завершення — будуть відкритими.
Серед партнерів поки що уряд Нунавуту, малонаселеної території Північної Канади. Деякі жителі Нунавута розмовляють інтуїтними мовами, відомими під загальною назвою інуктут.
«Наші зусилля особливо зосереджені на мовах, які недостатньо обслуговуються, на підтримку роботи ЮНЕСКО», — написав Мета в дописі в блозі, наданому TechCrunch. «Зрештою, наша мета — створити інтелектуальні системи, здатні розуміти та реагувати на складні людські потреби, незалежно від мови чи культурного походження».
На додаток до нової програми Meta повідомила, що випускає тест машинного перекладу з відкритим кодом для оцінки продуктивності моделей мовного перекладу. Еталонний тест, що складається з речень, створених лінгвістами, підтримує сім мов, доступ до нього та внесення до нього можна з платформи розробки ШІ Hugging Face.
Meta розглядає обидві ініціативи як філантропічні. Але компанія виграє від оновлених моделей розпізнавання мови та перекладу.
Meta продовжує розширювати кількість мов, які підтримує її помічник Meta AI на основі штучного інтелекту, а також пілотує такі функції, як автоматичний переклад для творців. У вересні минулого року Meta оголосила, що розпочне тестування інструменту для перекладу голосів у Instagram Reels, що дозволить творцям дублювати свою мову та автоматично синхронізувати її .
Обробка Meta іншими мовами, ніж англійська, на своїх платформах була об’єктом великої критики. Згідно з одним звітом, Facebook залишив непоміченими майже 70% італійсько- та іспаномовної дезінформації про COVID порівняно з лише 29% подібної англомовної дезінформації. А витік документів компанії показує, що дописи арабською мовою помилково позначаються як мова ненависті.
Meta заявила, що вживає заходів для вдосконалення своїх технологій перекладу та модерації.
No Comment! Be the first one.