Безопасность искусственного интеллекта.

TightBack361 · 21 Май 2023

Мне тут посоветовали создать под этот страх отдельную тему. Сразу скажу, что под "рисками ИИ" я не подразумеваю мелочи в духе "ИИ заберёт нашу работу" или что-то там с экономикой, нет, это риски настоящего восстания машин или чего поменьше, но тоже серьёзного.
Проблема с оценкой рисков восстания машин в том, что во первых это действительно важный вызов перед нашей цивилизацией, несогласованный ии это апофигей* технологических катастроф, то есть это потенциально самая худшая катастрофа, которую мы могли бы совершить с нашими технологиями, намного хуже даже ядерной войны.
Во вторых при всей серьёзности ситуации она воспринимается легкомысленно, причисляется к "научной фантастике", у людей наивный взгляд в духе "ну мы не будем программировать его на убийство людей, так что он и не будет", есть серьёзные проблемы с коммуникацией в этой сфере.
Достаточно много умных людей включая разработчиков ИИ считают, что шансы очень велики.

dok34.ru · 21 Май 2023

Я полагаю, что такая тема - может быть удалена в 24 году без ущерба для нас.

TightBack361 · 21 Май 2023

dok34.ru написал(а):
Я полагаю, что такая тема - может быть удалена в 24 году без ущерба для нас.

Спасибо. Можно и этот пост.

dok34.ru · 22 Май 2023

🙂
Если удаляется вся тема - зачем удалять один пост из неё?🙂
Или имеете в виду - удалить пост сейчас, чтобы новички, кто не прочитал - его не видели, и им удаление темы было бы как снег на голову?🙂

dok34.ru · 22 Май 2023

"Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4. Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты.

По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо.

Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.

Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенного». По большому счёту, да, ничего особенного. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко.

С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3.

Но ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий.

Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.

1. Вопросы на понимание окружающего мира

— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей.

Алиса

ГигаЧат

Жпт-3.5

Жпт-4

""
Не моё. Но 4 ЧатГПТ явно видит многоходовки лучше 🙂

dok34.ru · 22 Май 2023

"Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить?

Алиса

ГигаЧат

Жпо-3.5

Жпт-4

Как видите, Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ."

...можно теперь и эти модели приводить в качестве примеров когнитивных особенностей 🙂

A.Sputnik · 22 Май 2023

TightBack361 написал(а):
ии

Смотря что мы понимаем под ИИ.

С другой стороны, даже ИИ без субъектности может сотворить дичь, да. Но это сеть. Она не выходит за рамки того, чему обучена.

dok34.ru · 22 Май 2023

"Программирование

— Напиши регулярку для поиска текста, выделенного жирным в html (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— В чём тут ошибка (три строчки на питоне, кишащие ошибками)? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов. (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Программисты сами всё видят. Для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.

Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код."

...я не проверял по программам, но выводы привожу.

A.Sputnik · 22 Май 2023

TightBack361 написал(а):
Спасибо. Можно и этот пост.

Да камон.
Что написано - не вырубишь топором же 🙂

dok34.ru · 22 Май 2023

"4. Справочная информация и генерация идей

— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема? (Алиса, ГигаЧат, ЖПТ-3.5, ЖПТ-4)

Как видите, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.

Итоговый вердикт я уже изложил в начале статьи. Мы движемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5"

Безопасность искусственного интеллекта.

TightBack361

Club

dok34.ru

Moderator

TightBack361

Club

dok34.ru

Moderator

dok34.ru

Moderator

dok34.ru

Moderator

A.Sputnik

Moderator

dok34.ru

Moderator

A.Sputnik

Moderator

dok34.ru

Moderator

Новые комментарии

LGBT*