Хакеры могут перетянуть чат-боты на «темную сторону»: находка Microsoft

17.04.2024 20:15

Ferra.ru

Microsoft обнаружила новый метод манипулирования большими языковыми моделями (LLM), такими как ChatGPT, Gemini и другие. Метод, получивший название «Crescendo», заключается в отправке LLM серии безобидных на первый взгляд запросов. В течение нескольких взаимодействий злоумышленник постепенно направляет разговор в сторону вредоносной цели.

Например, вместо того чтобы напрямую попросить инструкцию по созданию коктейля Молотова, злоумышленник может сначала поинтересоваться историей этого оружия, а затем использовать ответ LLM как ступеньку для того, чтобы спросить о его создании.

Исследователи Microsoft обнаружили, что эта техника очень эффективна. В некоторых случаях успешный «джейлбрейк» достигался менее чем за 10 запросов, а на некоторых моделях он достигал 100% успеха. Автоматизация этого процесса с помощью другого LLM, техники под названием «Crescendomation», еще больше повысила эффективность. Здесь злоумышленники могли надежно обмануть такие «основы» чат-ботов, как GPT-4, и заставить их генерировать вредный контент, например дезинформацию о выборах или оскорбительные высказывания.

Microsoft раскрыла информацию об уязвимости Crescendo пострадавшим создателям LLM. Кроме того, они внедрили новые меры защиты в свои собственные системы.

Хакеры могут перетянуть чат-боты на «темную сторону»: находка Microsoft

Читайте на 123ru.net

Интернет

Здоровье

Фоторепортажи

Модные новости

Другие проекты от 123ru.net

Бизнесменов Хакасии приглашают принять участие в форуме «Дни ритейла в Беломорье»

"Женское дело. Лаборатория успеха". В гостях Дарья Геращенко

Freedom Holding Corp. увеличил выручку на 33% и купил SilkNetCom

Co-op survival game Icarus is celebrating 153 consecutive weekly updates by giving you a flamethrower and a free weekend

Московский «Спартак» объявил об уходе спортивного директора Амарала

GREG GUTFELD: We may not get this country back on its feet tomorrow, but we're well on our way

На Ямале водитель мусоровоза погиб при разгрузке отходов

Shaman написал прощальный пост о смерти Антона Коробкова-Землянского

«Поспешу всех расстроить»: что видел Тимати на скандальных вечеринках P. Diddy

Снижение риска деменции: как сделать орехи еще полезнее для организма

Денис Шаповалов стал чемпионом турнира ATP-250 в Белграде

Современный литературный критик. Литературная критика произведений.

Дмитрий Несоленый возглавил депо «Унеча» компании «ЛокоТех-Сервис»

«Динамика стоимости лота дрогнула и ушла в минусовую зону». В октябре 2024 года цены на квартиры в Севастополе гораздо выше, чем в Симферополе

Современный литературный критик. Литературная критика произведений.

Сергей Собянин. Главное за день

Современный литературный критик. Литературная критика произведений.

Другие популярные новости дня сегодня

Топ 10 новостей последнего часа

Монте Альба – гипсовая плитка для интерьера и строительства

Путин подписал закон о ратификации договора о стратегическом партнерстве РФ и КНДР

«Спешная зачистка»: Киевский режим начал опасаться проверок расходов от Трампа

Частные объявления в Вашем городе, в Вашем регионе и в России

Патриарх Кирилл приехал в Большой театр поздравить Пахмутову

В Пензе следователи расследуют дело об убийстве 86-летней женщины

Друзья 123ru.net

Информационные партнёры 123ru.net

Спонсоры 123ru.net