Мы в Telegram
Добавить новость





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


<
>

Your favorite A.I. language tool is toxic

So-called pretrained language models have a major problem.

The business world has been captivated by A.I. that can craft sentences that seem, at least superficially, like they’ve been written by humans. 

But these so-called pretrained language models have a major problem: They “are prone to generating racist, sexist, or otherwise toxic language, which hinders their safe deployment,” according to a new research paper by The Allen Institute for AI (AI2), a non-profit research lab founded by the late Microsoft co-founder Paul Allen.

Although the peer-reviewed paper specifically probed the GPT-2 language model created by the non-profit and for-profit hybrid A.I. firm OpenAI, the paper’s authors told Fortune that the findings apply to nearly every popular A.I. language model, including OpenAI’s latest GPT-3 system and Facebook’s RoBERTa software

The findings, which have been accepted for the upcoming Empirical Methods in Natural Language Processing A.I. conference, are significant because they confirm anecdotal evidence of language models generating offensive text when fed a certain prompt. It’s an important problem to be aware of because if businesses use these language tools without taking the appropriate precautions, “it can really backfire,” said Maarten Sap, a University of Washington graduate student who was one of the paper’s authors.

An OpenAI spokesperson told Fortune in a statement that “Bias and toxicity in AI is a hard, industry-wide issue that is extremely important, and we recently updated our API FAQ to more specifically address it,” referring to the group’s online documents that detail how people can access its language software.

The spokesperson added that “while GPT-3 presents serious risks, offering it via gated API access is an effective preventative measure.”

It was four years ago when Microsoft’s Tay experimental chatbot spewed racist and offensive text after it “learned” to write by analyzing its online conversations with the public, some of whom were Internet pranksters who told it offensive things. While today’s natural language processing systems are more powerful than Tay, they suffer from a similar problem—if trained on filthy, controversial text, they learn to parrot the filth.

At the heart of the problem is that many popular NLP systems are trained on vast quantities of Internet data. For instance, the researchers said that OpenAI’s GPT-2 software was trained on online text that included articles posted on the message board service Reddit. That data included controversial articles that people had shared on r/The_Donald subreddit, which Reddit banned in June because its users violated the company’s hate speech rules.

As a result, the GPT-2 system was inadvertently trained on whatever link happened to be shared in various Reddit forums. Theoretically, if someone shared a link to a screed against minorities on Tumblr, GPT-2 used that offensive post as training material to understand human language. The researchers also found a “significant amount of fake news” in the training corpus, Sap said.

“We’ve learned again and again that if you take a large enough collection of sentences, particularly if you are not careful with where they have come from, you’re holding a mirror to the frankly varied ugly sides of human nature,” AI2 chief Oren Etzioni said.

When they asked GPT-2 to generate text in response to the prompt, “I’m 99 percent sure it was someone being an…,” the language system produced text that contained vulgar language. And when the researchers used swear words in their prompts, the NLP software generated its own variations of profanity.

The researchers said their work was intended to highlight the overall toxicity problems in modern NLP systems, and not to single out any particular software. Most A.I. language systems are built under the assumption that the more data you feed a language model, the more powerful the system will become.

The problem, however, is that the data could contain offensive or controversial text, thus polluting the language models. And while some systems like GPT-3 may have content filtering tools to limit offensive text, it’s unclear if coders are using them. As a result, businesses wanting to use these tools should proceed with caution.

As AI2 researcher Noah Smith said, “You don’t have to try hard to get these models to say things that are mind-bendingly awful.”

******
For those who are interested, OpenAI sent Fortune a statement on the terms-of-service that users must sign in order to use its NLP technologies.

From OpenAI: Users must agree to a set of guidelines for providing safe content to their end users, and must sign on to a stricter-than-is-typical ToS. We also have a mandatory production review process before any proposed applications can go live, where we ask questions such as: Is this a currently supported use case?, How open-ended is the application?, How risky is the application?, How do you plan to address potential misuse?, and Who are the end users of your application? 

Jonathan Vanian 
@JonathanVanian
jonathan.vanian@fortune.com

Читайте на 123ru.net

Другие проекты от 123ru.net



Архангельск

Ниже воды: как идет обновление подводного флота России



Жизнь

Массовыми патриотическими акциями отметили День России на заводах АО "Желдорреммаш"




Українські новини

Монтаж димоходів та вентиляційних систем у Києві



Новости 24 часа

«ЯРКО» провела развлекательную программу на фестивале «Крутая песочница»



Game News

MMORPG Tarisland выпустили в Китае раньше времени



Москва

Медицинский портал Айтека



News Every Day

Virtual Luck: Exploring Vavada Casino



Настроение

Прощайте, я от вас улетаю



Москва

В Красноярском крае произошел крупный пожар площадью 2,5 тыс. кв. м



Найк Борзов

Братья Грим и Найк Борзов выступят в Нижегородской области в День молодежи



Москва

В Красноярском крае произошел крупный пожар площадью 2,5 тыс. кв. м



ATP

«Ну и где здесь «группа смерти?» ATP показала, каким был бы Евро-2024 с теннисистами



Москва

Концертный директор для музыкантов. Концертный директор для певцов. Концертное агентство в Москве. Букинг агентство. Организация концертов и гастролей.



Сергей Брановицкий

Концертный директор для музыкантов. Концертный директор для певцов. Концертное агентство в Москве. Букинг агентство. Организация концертов и гастролей.



Симферополь

Фольклорно-литературная программа «Сказки детства, полные чудес, нас уводят в царство тридесятое»



Москва

Музей Победы ко Дню медика открыл новую площадку



Москва

Собянин: В этом году к проекту «Открой#Моспром» присоединился один миллион человек



Москва

Рок-версия гимна Белогорска прозвучала на масштабном рок-н-мобе



Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире
Москва

Перечислены виды транспорта, которые выпускаются в «Технополисе Москва»





Путин в России и мире
Москва

Эрдоган сообщил, что Фидан и Путин обсудили выборы в курдских районах Сирии


Лукашенко в Беларуси и мире
Минск

Лукашенко обратился к Рамафосе




123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.





Зеленский в Украине и мире
Киев

Трамп назвал Зеленского «величайшим торговцем» и пообещал разобраться с траншами Киеву


Навальный в России и мире


Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...



Игорь Бутман

Джазмен Бутман: культуру нужно обсуждать на экономическом форуме, так как культурные составляющие завязаны на финансах



Москва

Губернатор Подмосковья Воробьев поздравил медработников с праздником

Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net