LLM
Определение
Большая языковая модель (LLM) — нейронная сеть с миллиардами параметров, обученная на огромных текстовых корпусах для понимания и генерации естественного языка.
Простое объяснение
LLM — это суперумная программа, которая прочитала почти весь интернет и научилась писать тексты как человек.
Подробнее
Характеристики LLM:
- Миллиарды/триллионы параметров
- Обучение на интернет-масштабных данных
- Способность к few-shot learning
- Emergent abilities (рассуждения, код)
Примеры: GPT-4, Claude 3, Gemini, LLaMA, Mistral.
Связанные термины
LLaMA
LLaMA (Large Language Model Meta AI) — семейство открытых языковых моделей от Meta, ставшее основой для множества производных моделей.
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
Token
Токен — минимальная единица текста, обрабатываемая языковой моделью; обычно это слово, часть слова или символ.
Inpainting
Inpainting — техника заполнения выделенных областей изображения новым контентом, сгенерированным AI с учётом контекста.
