Хранилище данных
Определение
Хранилище данных (Data Warehouse) — централизованная система для хранения и анализа больших объёмов структурированных данных для бизнес-аналитики и AI.
Простое объяснение
Это большой склад для данных компании, откуда AI и аналитики могут брать информацию для анализа и обучения.
Подробнее
Современные хранилища для AI:
- Snowflake — облачный DWH
- BigQuery — Google Cloud
- Databricks — unified analytics + ML
- ClickHouse — быстрая аналитика
DWH + AI = data-driven decisions.
Связанные термины
Семантический поиск
Семантический поиск — поиск информации по смыслу, а не по ключевым словам, с использованием эмбеддингов и векторных баз данных.
Text Classification
Text Classification — автоматическое присвоение текстам категорий или меток на основе их содержания.
Machine Translation
Machine Translation — автоматический перевод текста с одного языка на другой с помощью AI-моделей.
MMLU
MMLU (Massive Multitask Language Understanding) — бенчмарк для оценки знаний и способности к рассуждению LLM по 57 предметным областям.
