Bias
Определение
Предвзятость в AI — систематические ошибки или искажения в данных и алгоритмах, которые приводят к несправедливым или дискриминационным результатам.
Простое объяснение
Это когда AI учится на «неправильных» примерах и начинает делать несправедливые выводы — как если бы ты судил обо всех людях только по своим друзьям.
Подробнее
Bias может возникать на разных этапах:
- Data bias — нерепрезентативные обучающие данные
- Algorithmic bias — особенности архитектуры модели
- Human bias — предубеждения разработчиков
Примеры: AI для найма, предпочитающий мужчин; системы распознавания лиц с ошибками для определённых этнических групп.
Связанные термины
Jailbreak
Jailbreak — техники обхода встроенных ограничений AI-модели для получения запрещённых ответов или нежелательного поведения.
XAI
XAI (Explainable AI) — подход к созданию AI-систем, чьи решения и процесс рассуждений можно объяснить и понять человеку.
Constitutional AI
Constitutional AI — подход Anthropic к созданию безопасного AI, где модель обучается следовать набору принципов (конституции) через самокритику и ревизию.
AI Governance
Система управления AI: политики, процессы и контроли для ответственного использования искусственного интеллекта.
