Embedding
Определение
Эмбеддинг — представление данных (текста, изображений, аудио) в виде числовых векторов, где семантически близкие объекты располагаются рядом в векторном пространстве.
Простое объяснение
Это способ превратить слова в числа так, чтобы похожие по смыслу слова были рядом. Как если бы «кошка» и «котёнок» стояли близко на числовой линейке.
Подробнее
Эмбеддинги — основа современного AI:
- Word embeddings — Word2Vec, GloVe
- Sentence embeddings — для семантического поиска
- Image embeddings — CLIP, для поиска по изображениям
Применение: RAG-системы, рекомендации, кластеризация, поиск похожих документов.
Связанные термины
KV Cache
KV Cache — механизм кэширования ключей (Keys) и значений (Values) в трансформерах для ускорения авторегрессивной генерации.
Фича
Фича (признак, feature) — входной параметр или характеристика данных, используемая ML-моделью для обучения и предсказаний.
MoE
Mixture of Experts — архитектура нейросети, состоящая из множества специализированных подсетей (экспертов) и маршрутизатора, который направляет входные данные к наиболее подходящим экспертам.
Глубокое обучение
Подмножество машинного обучения, использующее многослойные нейронные сети для анализа данных.
