[#] Парсим weblancer используя PROXY
habrabot(difrex,1) — All
2017-02-27 09:30:03


__

## Цель работы


__

####

1. Парсим сайт, используя прокси-сервера.
2. Сохраняем данные в формате CSV.
3. Пишем поисковик по найденным данным.
4. Строим интерфейс.


![][1]

Использовать будем язык программирования Python. Сайт, с которого мы будем качать данные — [www.weblancer.net][2] (парсинг старой версии этого сайта был размещен [здесь][3]), в нем есть предложения работы по адресу [www.weblancer.net/jobs][4]. С него мы и будем получать данные — это название, цена, количество заявок, категория, краткое описание предлагаемой работы.

Вход с использованием прокси означает — вход на сайт под ненастоящим адресом. Пригодится для парсинга сайта с защитой бана по IP адресу (то есть, если вы слишком часто, за короткий отрезок времени, входите на сайт). [Читать дальше →][5]

[1]: https://habrastorage.org/files/2ee/bc8/fe8/2eebc8fe855d47e5a45df619b4c6c5b8.JPG
[2]: http://www.weblancer.net
[3]: https://www.youtube.com/watch?v=KPXPr-KS-qk&t=301s
[4]: http://www.weblancer.net/jobs/
[5]: https://habrahabr.ru/post/322608/?utm_source=habrahabr&utm_medium=rss&utm_campaign=feed_posts#habracut