RAG
Определение
RAG (Retrieval-Augmented Generation) — архитектура, дополняющая LLM актуальной информацией из внешних источников через поиск перед генерацией ответа.
Простое объяснение
Это когда AI сначала ищет нужную информацию в базе данных, а потом использует её для ответа — как ученик, который может пользоваться учебником.
Подробнее
Компоненты RAG:
- Indexing — создание эмбеддингов документов
- Retrieval — поиск релевантных фрагментов
- Augmentation — добавление в контекст
- Generation — генерация ответа LLM
RAG решает проблему устаревших знаний и галлюцинаций.
Связанные термины
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
LLaMA
LLaMA (Large Language Model Meta AI) — семейство открытых языковых моделей от Meta, ставшее основой для множества производных моделей.
GAN
Generative Adversarial Network — архитектура из двух конкурирующих нейросетей: генератора, создающего данные, и дискриминатора, отличающего реальные данные от сгенерированных.
Inpainting
Inpainting — техника заполнения выделенных областей изображения новым контентом, сгенерированным AI с учётом контекста.
