Спарсить информацию с закрытого паролем сайта. 65000 строк
ДАНО
Есть сайт - база данных различных компаний.
К нему есть доступ (логин и пароль) Без доступа информация сильно ограничена.
ЗАДАЧА
Нужно спарсить список компаний 65 000 Спарсить нужно лишь один раз!!!
Список без пагинации (lazy load подружает следующие 20 строчек) (gif прикрепил)
Помимо списка нужно зайти в профиль каждой компании и собрать из профиля тоже кое какую инфу
Я прикрепил два скриншота (1 - список с обозначением какая инфа нужна / 2 - профиль тоже с выделенной инфой)
БЮДЖЕТ
5000
СРОК
3 дня
НА ВЫХОДЕ
Google документ или Excel или CSV
с десятью колонками
Name / Description / Year / City / Category / Website link / Profile link / Annual Revenue / Emplooyes / Acquisitions
в идеале конечно еще с картинкой логотипом но не обязательно
ДАЛЕЕ
Пару слов о своем опыте с парсерами