Speech-to-Text
Определение
Speech-to-Text (STT) — технология автоматического распознавания речи и преобразования её в текст.
Простое объяснение
STT — как стенографист, который мгновенно записывает всё, что вы говорите. Только работает 24/7, не устаёт и понимает сотню языков.
Подробнее
Связанные термины
Vision-Language Model
Vision-Language Model — мультимодальная модель, способная обрабатывать и понимать как изображения, так и текст, отвечая на вопросы о визуальном контенте.
LLM
Большая языковая модель (LLM) — нейронная сеть с миллиардами параметров, обученная на огромных текстовых корпусах для понимания и генерации естественного языка.
Prompt Engineering
Промпт-инжиниринг — искусство и наука составления эффективных запросов (промптов) к AI-моделям для получения качественных результатов.
Hallucination
Галлюцинация AI — генерация языковой моделью информации, которая выглядит правдоподобно, но является фактически неверной или выдуманной.
