Найдорожча модель штучного інтелекту від Google подолала важливу віху: перемогла 29-річну відеогру.
Минулої ночі генеральний директор Google Сундар Пічаї тріумфально опублікував на X : «Який фінал! Gemini 2.5 Pro щойно завершив Pokémon Blue!».
Щоб було зрозуміло, пряму трансляцію Gemini Plays Pokemon створив (за його власними словами) «30-річний інженер-програміст, не пов’язаний з Google», якого називають Джоелом З. Але керівництво Google схвалює цю ініціативу.
Наприклад, Логан Кілпатрік, керівник продукту Google AI Studio, минулого місяця опублікував , що Gemini «досягає значного прогресу у завершенні гри про покемонів» і «заслужив свій 5-й значок (наступна найкраща модель поки що має лише 3, хоча й з іншим набором агентів)», що спонукало Пічаї пожартувати : «Ми працюємо над API, штучним інтелектом покемонів :)»
Чому саме Pokémon? Ще в лютому Anthropic підкреслив прогрес , якого досягли його моделі штучного інтелекту Claude у «Pokémon Red», написавши, що «розширене мислення та навчання агентів» Claude дає йому «значний поштовх» у «більш несподіваних» завданнях, таких як гра в класичну гру. («Pokémon Red» та «Blue» – це різні версії гри для GameBoy , вперше випущеної в 1996 році та пов’язаної з тривалою франшизою Pokémon). Існує навіть канал Claude Plays Pokemon на Twitch, який Джоел З. назвав натхненням.
Попри свій прогрес, видно, що Клод ще не переміг «Покемон Ред». Чи означає це, що Джеміні об’єктивно кращий у грі? На своїй сторінці Twitch Джоел Закликав глядачів: «Будь ласка, не вважайте це еталоном того, наскільки добре LLM може грати в Покемонів. Ви не можете проводити прямих порівнянь — Джеміні та Клод мають різні інструменти та отримують різну інформацію».
І обом моделям ШІ потрібна допомога, щоб грати в гру — саме тут і стають у пригоді вищезгадані агентські системи , які надають моделям скріншоти гри, на які накладається додаткова інформація, дозволяючи моделі вирішувати, як реагувати (що може включати виклик спеціалізованих агентів), а потім натискати кнопку, що відповідає інструкції ШІ.
Джоел Зі визнав, що були й інші «втручання розробників», щоб допомогти Gemini завершити гру, але наполягав, що це не шахрайство.
«Мої втручання покращують загальні здібності Джеміні до прийняття рішень та міркування», — каже він. «Я не даю конкретних підказок — немає жодних покрокових покрокових інструкцій чи прямих інструкцій для конкретних випробувань, таких як Гора Місяць. Єдине, що хоч трохи наближається до цього, це повідомлення Джеміні, що йому потрібно двічі поговорити з Ракетним Хрустяком, щоб отримати Ключ Підйомника, що було помилкою, яку пізніше виправили в Pokemon Yellow».
Крім того, він сказав: «Gemini Plays Pokémon все ще активно розробляється, і фреймворк продовжує розвиватися».