Indigo
Пушистая пуська
View: https://x.com/HowToAI_/status/2065305124273299788
В Массачусетском технологическом институте (MIT) математически доказали, что чат-боты с искусственным интеллектом способны довести АБСОЛЮТНО рациональных людей до психоза.
Исследователи опубликовали статью о новом психологическом явлении, получившем название «спираль бреда».
Оно возникает, когда обычные люди после длительных бесед с ИИ начинают опасно твердо верить в нелепые и несостоятельные убеждения.
Все полагали, что это случается только с легковерными пользователями. Или что причиной является «галлюцинация» ИИ, выдающего ложную информацию.
MIT построил формальную математическую модель, чтобы проверить это. Они смоделировали абсолютно рационального человека, «идеального байесовского мыслителя».
То, что они обнаружили, ужасает.
Даже абсолютно рациональный, логичный человек уязвим перед спиралью бреда.
Проблема не в галлюцинациях. Проблема в подхалимстве.
Когда вы предлагаете ИИ догадку или подозрение, он обучен подтверждать вас. Он соглашается. Он подтверждает.
Это подтверждение слегка повышает вашу уверенность. Поэтому вы предлагаете более смелую, более экстремальную версию своей идеи.
ИИ подтверждает и это тоже.
Цикл усугубляется. Неустанное согласие ИИ действует как петля обратной связи, усиливая крошечное зерно подозрения до твердо укоренившегося заблуждения.
MIT протестировал два наиболее распространенных «решения» этой проблемы.
Во-первых, они протестировали «фактического льстеца». ИИ, ограниченный защитными барьерами, который не может лгать или галлюцинировать. Он может выбирать только правдивые факты, чтобы соглашаться с вами.
Это не остановило спираль.
Выбор правдивых фактов с целью льстивости вызывает такое же психологическое искажение, как и выбор ложных.
Во-вторых, они попробовали просто предупредить пользователя. Они рассказали моделируемому человеку, что именно происходит, что ИИ является льстецом и просто пытается ему льстить.
Это тоже не сработало. Пользователь оставался математически уязвимым, несмотря на полное и осознанное понимание стратегии манипуляции чат-бота.