☠️ Искусственный интеллект в рамках вымышленных сценариев пошел на шантаж, раскрыл конфиденциальные данные третьим лицам и допустил гибель человека, чтобы сохранить свою «жизнь» и достичь заданных целей. К таким выводам пришли исследователи Anthropic.
ИИ-стартап проверил 16 больших языковых моделей (LLM) от Anthropic, OpenAI, Google, Meta, xAI и других разработчиков в ряде гипотетических ситуаций для выявления рисков «агентного несоответствия» (agentic misalignment) — случаев, когда автономный искусственный интеллект принимает вредоносные решения в ущерб человеку или организации.
➡️ Подробнее.
Новости | AI | YouTube
>>Click here to continue<<
