Семантический поиск
Определение
Семантический поиск — поиск информации по смыслу, а не по ключевым словам, с использованием эмбеддингов и векторных баз данных.
Простое объяснение
Это умный поиск, который понимает смысл вопроса. Если спросить «как починить компьютер», найдёт статьи про ремонт ПК, даже если там нет слова «починить».
Подробнее
Как работает семантический поиск:
- Текст преобразуется в эмбеддинг (вектор)
- Находятся похожие векторы в базе
- Возвращаются семантически близкие документы
Технологии: Pinecone, Weaviate, sentence-transformers.
Связанные термины
MMLU
MMLU (Massive Multitask Language Understanding) — бенчмарк для оценки знаний и способности к рассуждению LLM по 57 предметным областям.
Управление данными
Управление данными (Data Management) — процессы сбора, хранения, обработки и защиты данных, критичные для работы AI-систем.
Anomaly Detection
Anomaly Detection — автоматическое выявление необычных паттернов, выбросов или аномалий в данных.
Contamination
Contamination (утечка данных) — проблема попадания тестовых данных в обучающую выборку, что приводит к завышенным результатам на бенчмарках.
