Хранилище данных
Определение
Хранилище данных (Data Warehouse) — централизованная система для хранения и анализа больших объёмов структурированных данных для бизнес-аналитики и AI.
Простое объяснение
Это большой склад для данных компании, откуда AI и аналитики могут брать информацию для анализа и обучения.
Подробнее
Современные хранилища для AI:
- Snowflake — облачный DWH
- BigQuery — Google Cloud
- Databricks — unified analytics + ML
- ClickHouse — быстрая аналитика
DWH + AI = data-driven decisions.
Связанные термины
Synthetic Data
Синтетические данные — искусственно сгенерированные данные, имитирующие реальные, используемые для обучения AI при недостатке или конфиденциальности реальных данных.
Contamination
Contamination (утечка данных) — проблема попадания тестовых данных в обучающую выборку, что приводит к завышенным результатам на бенчмарках.
Leaderboard
Leaderboard — таблица рейтингов AI-моделей по результатам стандартизированных бенчмарков, позволяющая сравнивать их производительность.
Recommendation System
Recommendation System — алгоритм, предсказывающий предпочтения пользователя и предлагающий релевантный контент или продукты.
