OCR
Определение
Оптическое распознавание символов (OCR) — технология AI для преобразования изображений текста (сканов, фото) в редактируемый цифровой текст.
Простое объяснение
Это когда программа может прочитать текст с картинки или фотографии и превратить его в обычный текст, который можно копировать.
Подробнее
Современный OCR включает:
- Детекция текста — поиск областей с текстом
- Распознавание — преобразование в символы
- Layout analysis — понимание структуры документа
- Handwriting recognition — рукописный текст
Инструменты: Tesseract, Google Vision, AWS Textract.
Связанные термины
Шкалирование
Шкалирование (масштабирование) — увеличение мощности AI-системы для обработки большего объёма запросов и данных.
ChatGPT
ChatGPT — разговорный AI-ассистент от OpenAI на базе моделей GPT, способный вести диалог, отвечать на вопросы, писать тексты и код.
Edge AI
Edge AI — выполнение AI-алгоритмов непосредственно на конечных устройствах (смартфонах, камерах, датчиках) без отправки данных в облако.
Whisper
Whisper — открытая модель распознавания речи от OpenAI, способная транскрибировать и переводить аудио на 99 языках.
