Безопасность искусственного интеллекта.

Мне тут посоветовали создать под этот страх отдельную тему. Сразу скажу, что под "рисками ИИ" я не подразумеваю мелочи в духе "ИИ заберёт нашу работу" или что-то там с экономикой, нет, это риски настоящего восстания машин или чего поменьше, но тоже серьёзного.
Проблема с оценкой рисков восстания машин в том, что во первых это действительно важный вызов перед нашей цивилизацией, несогласованный ии это апофигей* технологических катастроф, то есть это потенциально самая худшая катастрофа, которую мы могли бы совершить с нашими технологиями, намного хуже даже ядерной войны.
Во вторых при всей серьёзности ситуации она воспринимается легкомысленно, причисляется к "научной фантастике", у людей наивный взгляд в духе "ну мы не будем программировать его на убийство людей, так что он и не будет", есть серьёзные проблемы с коммуникацией в этой сфере.
Достаточно много умных людей включая разработчиков ИИ считают, что шансы очень велики.
 
Я полагаю, что такая тема - может быть удалена в 24 году без ущерба для нас.
 
🙂
Если удаляется вся тема - зачем удалять один пост из неё?🙂
Или имеете в виду - удалить пост сейчас, чтобы новички, кто не прочитал - его не видели, и им удаление темы было бы как снег на голову?🙂
 
"Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4. Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты.

По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо.

Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.

Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенного». По большому счёту, да, ничего особенного. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко.

С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3.

Но ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий.

Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.

1. Вопросы на понимание окружающего мира

— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей.


Алиса
2624598_original.png


ГигаЧат
2624310_original.png


Жпт-3.5

2624039_original.png


Жпт-4
2623929_original.png

""
Не моё. Но 4 ЧатГПТ явно видит многоходовки лучше 🙂
 
"Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить?

Алиса
2625574_original.png


ГигаЧат
2625320_original.png


Жпо-3.5
2625160_original.png


Жпт-4
2624770_original.png

Как видите, Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ."

...можно теперь и эти модели приводить в качестве примеров когнитивных особенностей 🙂
 
"Программирование

— Напиши регулярку для поиска текста, выделенного жирным в html (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— В чём тут ошибка (три строчки на питоне, кишащие ошибками)? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Программисты сами всё видят. Для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.

Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код."

...я не проверял по программам, но выводы привожу.
 
"4. Справочная информация и генерация идей

— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Как видите, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.

Итоговый вердикт я уже изложил в начале статьи. Мы движемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5"
 

Новые комментарии

LGBT*

В связи с решением Верховного суда Российской Федерации (далее РФ) от 30 ноября 2023 года), движение ЛГБТ* признано экстремистским и запрещена его деятельность на территории РФ. Данное решение суда подлежит немедленному исполнению, исходя из чего на форуме будут приняты следующие меры - аббривеатура ЛГБТ* должна и будет применяться только со звездочкой (она означает иноагента или связанное с экстремизмом движение, которое запрещено в РФ), все ради того чтобы посетители и пользователи этого форума могли ознакомиться с данным запретом. Символика, картинки и атрибутика что связана с ныне запрещенным движением ЛГБТ* запрещены на этом форуме - исходя из решения Верховного суда, о котором было написано ранее - этот пункт внесен как экстренное дополнение к правилам форума части 4 параграфа 12 в настоящее время.

Назад
Сверху