Итоговый проект по курсу Python для аналитиков
Курс состоит из 8 уроков
Итоговая работа курса:
1. Скачать данные о рынке недвижимости c открытого соревнования Сбербанка по машинному обучению https://www.kaggle.com/c/sberbank-russian-housing-market/data.
Скачиваем только файлы train.csv.zip, macro.csv.zip и сливаем в один датафрейм. Описание колонок - data_dictionary.txt
2. Провести чистку данных (пропуски данных, неинформативные признаки, аномалии, оцифровка текстовых столбцов и т.п.)
3.Провести Exploratory Data Analysis. Проанализировать переменные, влияющие на зависимую переменную - стоимость недвижимости price_doc.
4. Разделить датасет на обучающие и тестовую выборки.
5. Обучить регрессионную модель предсказывать стоимость недвижимости в зависимости от разных факторов и выявить показатели качества модели на обучающей и тестовой выборке.
6. Реализовать методы feature engineering с целью повышения метрик качества модели.
Результат - ссылка на готовый ноутбук в Colab с выводами.
Стоимость: 3000 руб. при условии получения Отлично
2000 руб при условии получения Хорошо
Платеж разделен на две части:
1. 2000 по выполнению работы
2. оставшаяся часть по факту получения оценки