Shape complexity in cluster analysis

26.05.2023 17:00

Plos.org

by Eduardo J. Aguilar, Valmir C. Barbosa

In cluster analysis, a common first step is to scale the data aiming to better partition them into clusters. Even though many different techniques have throughout many years been introduced to this end, it is probably fair to say that the workhorse in this preprocessing phase has been to divide the data by the standard deviation along each dimension. Like division by the standard deviation, the great majority of scaling techniques can be said to have roots in some sort of statistical take on the data. Here we explore the use of multidimensional shapes of data, aiming to obtain scaling factors for use prior to clustering by some method, like k-means, that makes explicit use of distances between samples. We borrow from the field of cosmology and related areas the recently introduced notion of shape complexity, which in the variant we use is a relatively simple, data-dependent nonlinear function that we show can be used to help with the determination of appropriate scaling factors. Focusing on what might be called “midrange” distances, we formulate a constrained nonlinear programming problem and use it to produce candidate scaling-factor sets that can be sifted on the basis of further considerations of the data, say via expert knowledge. We give results on some iconic data sets, highlighting the strengths and potential weaknesses of the new approach. These results are generally positive across all the data sets used.

Shape complexity in cluster analysis

Читайте на 123ru.net

Разное на 123ru.net

Работа

Объявления

Game24.pro

Другие проекты от 123ru.net

Над Соловьёво поднят российский флаг, штурмовые группы ВС России замечены на окраинах Архангельского

Добраться до курортов Сочи станет этим летом намного дороже: озвучена причина и новые цены

Охорона і Безпека це ОіБ: замовляй охорону в Києві та Харькові

Более 100 студентов посетило СЛД Курск в рамках акции «Неделя без турникетов»

«Война миров: Сибирь»: что мы знаем о новой российской игре

Штраф за неуплату штрафа: Киркоров продолжает спорить из-за платной парковки

NYU Hospital on Long Island performs miraculous surgery

Портативный ТСД корпоративного класса Saotron RT-T70

Шойгу: у России нет и никогда не было планов нападать на страны НАТО

Рэпер Баста благословил девушку на брак во время своего концерта

Мир «Турбозавров» в Roblox: виртуальные приключения для детей!

Потапова всухую обыграла Шнайдер в 1-м круге турнира в Мадриде

Шапки женские вязаные на Wildberries, 2024 — новый цвет от 392 руб. (модель 466)

Шапки женские вязаные на Wildberries, 2024 — новый цвет от 392 руб. (модель 466)

Жители Марий Эл с мая смогут дистанционно оформить ипотеку на жилье в Крыму

Российские ученые первыми создали средство, способное вылечить болезнь Бехтерева

Собянин: Москва завершает переход на новый стандарт экстренной медпомощи

Российские ученые первыми создали средство, способное вылечить болезнь Бехтерева

Другие популярные новости дня сегодня

Топ 10 новостей последнего часа

Компания ICDMC стала победителем престижной премии в сфере ЗОЖ – Green Awards 2023/24

Эксперт: корректировка порогов крупного и особо крупного ущерба по экономическим статьям оправдана и своевременна

Лукашенко рассказал о планах расширения НАТО

Захарова: встречи по продвижению "формулы Зеленского" дают Киеву чувство вседозволенности

Частные объявления в Вашем городе, в Вашем регионе и в России

Вячеслав Бутусов и Юлия Пересильд выступят фестивале «Дикая Мята» с 14 по 16 июня

РИА «Новости»: в деле замминистра обороны Иванова появятся новые подозреваемые

Друзья 123ru.net

Информационные партнёры 123ru.net

Спонсоры 123ru.net