Американские исследователи из Калифорнийского университета в Лос-Анджелесе представили концепцию генератора изображений на основе ИИ, который практически не потребляет энергии.
Обычно генераторы изображений на базе искусственного интеллекта используют процесс, известный как диффузия. Они обучаются на большом наборе изображений и многократно добавляют статистический шум, пока изображение совсем не исчезнет. После того, как ИИ получает задание сгенерировать изображение, он сначала воспроизводит экран с большим количеством шумовых помех, а затем, удаляя их, возвращает изображение.
Если речь идет о генерации большого количества изображений, процесс становится медленным и энергозатратным. Новый генератор изображений использует цифровой кодер, обученный на общедоступных наборах данных, для создания статического сигнала. В конце концов этот сигнал и генерирует изображение. Это требует значительно меньшего количества энергии.
Многочисленные и экспериментальные результаты многоцветной оптической генеративной модели для создания цветных произведений искусства в стиле Ван Гога по сравнению с цифровой диффузионной моделью учителя с 1000 шагами/Nature
Жидкокристаллический экран, известный как пространственный модулятор света (SLM), наносит этот рисунок на лазерный луч. Затем луч проходит через второй декодирующий SLM, который преобразует рисунок в лазере в конечное изображение. В отличие от традиционных инструментов ИИ, которые требуют проведения миллионов компьютерных операций по вычислению, в этом случае свет выполняет подавляющую часть работы.
«Наши оптические генеративные модели способны синтезировать бесчисленное количество изображений практически без использования вычислительной мощности, предлагая масштабируемую и энергоэффективную альтернативу цифровым моделям ИИ», — объясняет ведущий автор исследования Шици Чэнь.
Исследователи испытали собственную систему на различных изображениях, которые используются для обучения ИИ, включая изображения известных людей, бабочек и полноцветные картины Винсента Ван Гога. Результаты были сопоставимы с результатами традиционных генераторов изображений, но потребляли гораздо меньше энергии. Этот прорыв потенциально может значительно сократить углеродный след контента, который создает ИИ.
Эта технология также может найти применение в различных областях. Поскольку система очень быстрая и потребляет мало энергии, ее можно использовать, например, для создания изображений и видео для дисплеев виртуальной и дополненной реальности, а также для небольших устройств, таких как смартфоны или электроника, например, очки с искусственным интеллектом.
Результаты исследования опубликованы в журнале Nature
Источник: TechXplore