Speech-to-Text
Определение
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Простое объяснение
STT — как стенографист, который мгновенно записывает всё, что вы говорите. Только работает 24/7, не устаёт и понимает сотню языков.
Подробнее
Связанные термины
Inpainting
Inpainting — техника заполнения выделенных областей изображения новым контентом, сгенерированным AI с учётом контекста.
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
Multimodal
Multimodal — способность AI-системы обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео.
ControlNet
ControlNet — метод точного управления генерацией изображений через дополнительные условия: позы, края, глубину, скетчи.
