Image-to-Image
Определение
Image-to-Image (img2img) — генерация нового изображения на основе входного с учётом текстового промпта и степени изменения.
Простое объяснение
Image-to-Image — как сказать художнику "возьми эту картинку за основу и перерисуй в другом стиле". Можно чуть изменить или полностью переосмыслить.
Подробнее
Связанные термины
Text-to-Speech
Text-to-Speech (TTS) — технология преобразования текста в естественно звучащую речь с помощью нейронных сетей.
Foundation Model
Фундаментальная модель — большая AI-модель, предобученная на огромных объёмах данных, которая может быть адаптирована для множества различных задач.
Gemini
Gemini — мультимодальное семейство AI-моделей от Google DeepMind, объединяющее понимание текста, изображений, аудио и видео.
Multimodal AI
Мультимодальный AI — системы, способные обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео — одновременно.
