OCR
Определение
Оптическое распознавание символов (OCR) — технология AI для преобразования изображений текста (сканов, фото) в редактируемый цифровой текст.
Простое объяснение
Это когда программа может прочитать текст с картинки или фотографии и превратить его в обычный текст, который можно копировать.
Подробнее
Современный OCR включает:
- Детекция текста — поиск областей с текстом
- Распознавание — преобразование в символы
- Layout analysis — понимание структуры документа
- Handwriting recognition — рукописный текст
Инструменты: Tesseract, Google Vision, AWS Textract.
Связанные термины
Jupyter Notebook
Jupyter Notebook — интерактивная среда разработки для анализа данных и машинного обучения, позволяющая комбинировать код, визуализации и текст.
API (Application Programming Interface)
Интерфейс программирования приложений — набор правил и протоколов для взаимодействия между различными программами и сервисами.
OpenAI
OpenAI — американская AI-компания, создатель ChatGPT, GPT-4, DALL-E и других прорывных AI-систем, лидер индустрии генеративного AI.
Kubernetes
Kubernetes (K8s) — платформа оркестрации контейнеров, ставшая стандартом для развёртывания и масштабирования ML-инфраструктуры.
