Добавить новость





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


Новые модели OpenAI галлюцинируют чаще - каждый третий их ответ неверный

Галлюцинации остаются одной из сложнейших проблем в сфере искусственного интеллекта. Обычно каждая новая ИИ-модель справляется немного лучше — выдает меньше недостоверной информации, чем предыдущие версии. Но, похоже, это не относится к o3 и o4-mini. Внутренние тесты OpenAI показали, что они галлюцинируют чаще, чем предыдущие «рассуждающие» модели компании (o1, o1-mini и o3-mini), а также чем их традиционные инструменты, например, GPT-4o.

При этом разработчики ChatGPT сами не до конца понимают, в чем тут дело. В техническом отчете о моделях o3 и o4-mini OpenAI признает необходимость дальнейших исследований, чтобы понять, почему улучшение аналитических способностей нейросети приводит к учащению случаев галлюцинаций. Хотя новые модели показывают лучшие результаты в программировании и математике, их склонность делать больше утверждений в целом приводит к парадоксальному эффекту: наряду с увеличением числа точных ответов растёт и количество ошибочных выводов.

Модель o3 галлюцинировала в ответ на 33% вопросов теста PersonQA — внутреннего бенчмарка компании для оценки точности знаний модели о людях. Этот показатель примерно вдвое превышает уровень галлюцинаций предыдущих «рассуждающих» моделей o1 и o3-mini, где частота ошибок составила 16% и 14,8% соответственно. Модель o4-mini показала ещё более тревожные результаты на PersonQA — выдавала ошибочные ответы в 48% случаев.

Сторонние испытания некоммерческой исследовательской лаборатории Transluce также выявили склонность модели o3 выдумывать действия, якобы совершенные для получения ответов. В одном из случаев o3 утверждала, что запускала код на MacBook Pro 2021 года «вне платформы ChatGPT», а затем вставила результаты в ответ. Хотя у o3 действительно есть доступ к некоторым инструментам, подобные действия она выполнить не способна. Кроме того, модель часто генерирует неработающие веб-ссылки, выдавая их за достоверные.

Галлюцинации могут способствовать генерации нестандартных идей и творческому «мышлению», однако они же делают модели малопригодными для сфер, где критически важна точность данных. Например, юридические фирмы вряд ли будут довольны ИИ, допускающим фактические ошибки в договорах. Один из перспективных методов повышения точности — интеграция веб-поиска. Например, GPT-4o с этой функцией достигает точности 90% в тесте SimpleQA.

В последний год отрасль переключилась на модели с развитым логическим мышлением, поскольку традиционные методы улучшения ИИ перестали давать значимый прогресс. Такие инструменты отлично справляются с разными задачами без необходимости в колоссальных вычислительных ресурсах и гигантских обучающих выборках. Однако проблему с галлюцинациями разработчикам еще предстоит решить.



Загрузка...

Читайте на сайте

Другие проекты от 123ru.net








































Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире




Путин в России и мире

Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.






Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...





Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net