Whisper
Определение
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
Простое объяснение
Whisper — это программа от OpenAI, которая слушает аудио и записывает всё, что там говорят, в текст. Работает на многих языках.
Подробнее
Возможности Whisper:
- Транскрипция — речь в текст
- Перевод — в английский с любого языка
- Timestamps — временные метки
- Language detection — определение языка
Размеры: tiny, base, small, medium, large. Open source.
Связанные термины
OpenAI
OpenAI — американская AI-компания, создатель ChatGPT, GPT-4, DALL-E и других прорывных AI-систем, лидер индустрии генеративного AI.
Jupyter Notebook
Jupyter Notebook — интерактивная среда разработки для анализа данных и машинного обучения, позволяющая комбинировать код, визуализации и текст.
API (Application Programming Interface)
Интерфейс программирования приложений — набор правил и протоколов для взаимодействия между различными программами и сервисами.
Latency
Латентность — время задержки между отправкой запроса к AI-системе и получением ответа, критичный показатель для пользовательского опыта.
