Модель
Определение
Модель в ML — обученный алгоритм, который принимает входные данные и выдаёт предсказания или генерирует результат.
Простое объяснение
Модель — это обученная программа, которая умеет делать что-то конкретное: писать текст, распознавать картинки или переводить.
Подробнее
Типы AI-моделей:
- Языковые — GPT, Claude, LLaMA
- Визуальные — Stable Diffusion, DALL-E
- Мультимодальные — GPT-4o, Gemini
- Специализированные — CodeLLaMA, MedPaLM
Модель = архитектура + веса (параметры).
Связанные термины
Zero-shot Learning
Zero-shot обучение — способность AI выполнять задачи, на которых модель не обучалась напрямую, используя общие знания и инструкции.
PEFT
Parameter-Efficient Fine-Tuning — семейство методов дообучения моделей, которые обновляют лишь малую часть параметров, сохраняя качество полного fine-tuning.
KV Cache
KV Cache — механизм кэширования ключей (Keys) и значений (Values) в трансформерах для ускорения авторегрессивной генерации.
Deep Learning
Глубокое обучение — подраздел машинного обучения, использующий многослойные нейронные сети для обработки сложных данных и выявления абстрактных паттернов.
