Google додав нову, експериментальну модель «вбудовування» для тексту, Gemini Embedding, до свого API розробника Gemini.
Моделі вбудовування перетворюють текстові введення, такі як слова та фрази, у числові представлення, відомі як вбудовування, які фіксують семантичне значення тексту. Вбудовування використовуються в ряді додатків, таких як пошук і класифікація документів, частково тому, що вони можуть зменшити витрати, одночасно покращуючи затримку.
Такі компанії, як Amazon, Cohere та OpenAI, пропонують моделі вбудовування через відповідні API. Google пропонував моделі вбудовування і раніше, але Gemini Embedding є першим тренінгом на сімействі моделей ШІ Gemini.
«Навчена на самій моделі Gemini, ця модель вбудовування успадкувала розуміння Gemini мови та нюансів контексту, що робить її застосовною для широкого спектра використання», — йдеться в повідомленні Google у блозі . «Ми навчили нашу модель бути надзвичайно загальною, забезпечуючи виняткову продуктивність у різноманітних сферах, включаючи фінанси, науку, право, пошук тощо».
Google стверджує, що Gemini Embedding перевершує продуктивність своєї попередньої найсучаснішої моделі вбудовування text-embedding-004 і досягає конкурентоспроможності в популярних тестах вбудовування. Порівняно з text-embedding-004, Gemini Embedding також може одночасно приймати більші фрагменти тексту та коду, а також підтримує вдвічі більше мов (понад 100).
Google зазначає, що Gemini Embedding перебуває на «експериментальній фазі» з обмеженою потужністю та може змінюватися. «[Ми] працюємо над стабільним, загальнодоступним випуском у найближчі місяці», — написала компанія у своєму блозі.