Добавить новость





160*600

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Актуальные новости сегодня от ValueImpression.com


Опубликовать свою новость бесплатно - сейчас


Педофилов вычислит компьютер

Сергей Кузнецов, заведующий Международной научно-учебной лабораторией интеллектуальных систем и структурного анализа (МНУЛ ИССА).

Алексей Незнанов, старший научный сотрудник МНУЛ ИССА

Дмитрий Игнатов, научный сотрудник МНУЛ ИССА

Более 80% информации, с которой работают следователи - это тексты, например, отчёты, составленные полицейскими в ходе патрулирования. Они вносятся в базы данных и образуют огромные массивы неструктурированной информации, автоматический анализ которой крайне затруднён. Группа математиков НИУ ВШЭ вместе с экспертами полиции Амстердам-Амстелланд и учёными Лёвенского католического университета разработали систему, способную анализировать большие коллекции текстов, и автоматически извлекать из них информацию, способную помочь следствию.

Это один из четырёх совместных проектов, реализованных учёными Лёвенского католического университета, математиками НИУ ВШЭ и экспертами криминальной полиции Амстердам-Амстелланд.

Сотрудничество россиян с голландской полицией началось в 2010 году, когда молодой учёный Лёвенского университета Йонас Пульманс пригласил Сергея Кузнецова и его коллег к участию в проектах по анализу криминальной обстановки в Амстердаме. "Мы могли предложить программные и методологические средства обработки данных, основанные на решётках формальных понятий, - пояснил Кузнецов. - Йонас Пульманс только начинал заниматься этой темой, а мы уже имели значительный опыт". Этот метод анализа позволяет визуализировать объектно-признаковые зависимости и широко применяется в информатике. Например, в компьютерной лингвистике, для анализа блогов и поиска сходства текстовых документов, в формировании рекомендаций.

За четыре года совместной работы учёные НИУ ВШЭ приняли участие в проектах связанных с домашним насилием, торговлей людьми, терроризмом и выявлением педофилов в интернет-чатах. В последнем случае нужно было определить взрослых людей, которые пытаются найти через Сеть несовершеннолетних сексуальных партнёров

Обычно злоумышленник действует так: подыскивает интернет-ресурс, привлекательный для детей и подростков, знакомится с другими участниками, затем пытается наладить более тесный контакт с потенциальной жертвой, завести разговор на сексуальные темы, "подогреть" беседу и, наконец, склонить ребёнка к реальной встрече. Объём информации в этих чатах огромен, их чтение и анализ вручную могут занимать слишком много времени. Поэтому полиции требовалась программа, которая смогла бы автоматически отыскивать возможных извращенцев.

Шкала педофилов

С точки зрения потенциальной опасности, голландские полицейские делят педофилов на три группы:

люди, которые считают возможными отношения с несовершеннолетними;те, кто хотят реализовать свои желания и рассматривают несовершеннолетних как зрелых и дееспособных партнёров;гиперсексуальные индивиды, имеющие большие коллекции детской порнографии и обширные онлайн связи с другими педофилами.Перед группой экспертов из России, Нидерландов и Бельгии стояла цель по созданию программы, которая могла бы сканировать интернет, распознавать подозрительные разговоры в чате и указывать уровень для безопасности ребёнка. В частности, нужно было:дать сотруднику полиции возможность быстро проанализировать основное содержание беседы и классифицировать её тематику;разработать шкалу уровней угрозы сессий в таких чатах и научить компьютер автоматически выставлять уровень потенциальной угрозы собеседника для ребёнка;написать программу, которая сможет на практике автоматически классифицировать огромные массивы информации из чатов по степени угрозы.

"Главной задачей было нахождение признаков того, что данный сеанс в чате происходит между педофилом и его жертвой, - рассказал участник проекта Алексей Незнанов. - Их нужно отличать от всех других сеансов, которые не относятся к данной тематике, чтобы не заподозрить обычных людей". Именно система на основе решёток формальных понятий, по словам учёного, помогает быстро выявить разговоры, которые могут представлять опасность для ребёнка.

Как плести сети

Исходными данными для анализа являлась большая текстовая коллекция. Её составлением и другими прикладными вопросами (где взять данные, на каких языках и т.д.) занимались эксперты криминальной полиции. Российские специалисты готовили теоретическую базу системы. "Мы должны были выявить признаки, которые с большой вероятностью указывали, что это чат с педофилом", - вспоминает Незнанов.

Сотрудники НИУ ВШЭ отбирали всё возможные подозрительные слова и словосочетания. Они делились по атрибутам: обсуждение внешности, организация свидания, обсуждение сексуальных предпочтений и аспектов встречи и т.д. Помимо интересующего слова как такового в базу включались всё варианты сокращённого написания, варианты с искажениями и ошибками, а также использование цифр вместо букв и слов (2 - to, 4 - for, …) - популярный приём СМС-сленга.

В свою очередь, коллеги из Лёвенского университета предложили итеративную методологию анализа данных, которая получила название CORDIET - Concept Relation Discovery and Innovation Enabling Technology. Итеративные методы позволяют сортировать информацию, непрерывно анализируя полученные результаты и, если нужно, внося коррективы в предшествующие этапы работы. В каждой фазе анализа данных повторяется цикл: планирование-реализация-проверка-оценка. Накопленные знания формализуются в виде семантической сети (онтологии специального вида).

По словам Незнанова, это была работа на стыке классической компьютерной лингвистики и машинного обучения, классической задачи построения онтологий и оригинальной задачи выявления знаний в конкретной прикладной области.

Решетки формальных понятий помогут в поиске

Результаты исследования позволили создать программные средства, позволяющие автоматизировать процесс поиска педофилов в Сети.

Сначала исследователи ввели некоторую коллекцию текстов и указали их метаданные (реквизиты, теги). После чего было автоматически построено объектно-признаковое описание этих данных, и на их основе были построены решётки формальных понятий и другие аналитические артефакты, позволяющие аналитику интерактивно их визуализировать и сделать необходимые заключения. Получающиеся визуальные схемы, по словам Незнанова, так просты, что "научиться работать с ними можно буквально за день". Единственной, но очень серьёзной проблемой является масштабирование интерактивного режима работы, так как с некоторого размера решётки необходимы интеллектуальные методы визуализации фрагментов решётки. Их разработка - одна из актуальных задач лаборатории.

Полученное программное обеспечение было протестировано эмпирически, а результаты описаны в серии научных статей.

Правда, поскольку данные чатов, собранные голландской полицией, по закону, не могут быть обнародованы, то для демонстрации работы системы использовались данные Американской общественной организации Perverted-Justice, которая также занимается поиском педофилов в интернете. Только роли потенциальных жертв там исполняли взрослые люди, которые должны втянуть в диалог потенциального педофила. Поведение "жертвы" в этом случае не является репрезентативным, поскольку это взрослый, но поведение подозреваемых реалистично, поскольку те верят, что общаются с несовершеннолетним.

Прикладная программа, разработанная на основе теоретической базы учёных НИУ ВШЭ, в настоящее время используется полицией Амстердама.

См. также:

Искусственный интеллект помогает бороться с работорговлейБольшие данные сделают общество ответственнееРешетки понятий помогут в борьбе с ракомПодростки редко откровенничают в соцсетяхМатематики помогли распознать домашнее насилие



Загрузка...

Читайте на сайте

Другие проекты от 123ru.net








































Другие популярные новости дня сегодня


123ru.net — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 123ru.net.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.



Новости 24/7 Все города России




Загрузка...


Топ 10 новостей последнего часа






Персональные новости

123ru.net — ежедневник главных новостей Вашего города и Вашего региона. 123ru.net - новости в деталях, свежий, незамыленный образ событий дня, аналитика минувших событий, прогнозы на будущее и непредвзятый взгляд на настоящее, как всегда, оперативно, честно, без купюр и цензуры каждый час, семь дней в неделю, 24 часа в сутки. Ещё больше местных городских новостей Вашего города — на порталах News-Life.pro и News24.pro. Полная лента региональных новостей на этот час — здесь. Самые свежие и популярные публикации событий в России и в мире сегодня - в ТОП-100 и на сайте Russia24.pro. С 2017 года проект 123ru.net стал мультиязычным и расширил свою аудиторию в мировом пространстве. Теперь нас читает не только русскоязычная аудитория и жители бывшего СССР, но и весь современный мир. 123ru.net - мир новостей без границ и цензуры в режиме реального времени. Каждую минуту - 123 самые горячие новости из городов и регионов. С нами Вы никогда не пропустите главное. А самым главным во все века остаётся "время" - наше и Ваше (у каждого - оно своё). Время - бесценно! Берегите и цените время. Здесь и сейчас — знакомства на 123ru.net. . Разместить свою новость локально в любом городе (и даже, на любом языке мира) можно ежесекундно (совершенно бесплатно) с мгновенной публикацией (без цензуры и модерации) самостоятельно - здесь.



Загрузка...

Загрузка...

Экология в России и мире




Путин в России и мире

Лукашенко в Беларуси и мире



123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.






Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...





Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net