rzaimx的gravatar头像
rzaimx 2019-03-02 23:02:30

python爬取前程无忧招聘网站数据及可视化分析

项目描述

从前程无忧招聘网站上进行网页抓取,提取各项数据,数据包含多个维度,分别是城市、岗位名称、公司名字、公司规模、公司类型、经验要求、学历要求、专业要求、福利待遇和所属行业等。对爬取的数据进行数据清洗及标准化后,实现数据分析和可视化。最后实践apriori算法,进行频繁项集提取及关联分析。

运行环境

python3.7  PyCharm

项目技术(必填)

python爬虫和可视化技术

是否原创(转载必填原文地址)

项目截图(必填)

python爬取前程无忧招聘网站数据及可视化分析

运行截图(必填)

python爬取前程无忧招聘网站数据及可视化分析python爬取前程无忧招聘网站数据及可视化分析

python爬取前程无忧招聘网站数据及可视化分析

python pi7.py

python爬取前程无忧招聘网站数据及可视化分析

python pi11.py

python爬取前程无忧招聘网站数据及可视化分析

python pi12.py

python爬取前程无忧招聘网站数据及可视化分析

注意事项

Traceback (most recent call last):
  File "pi1.py", line 11, in <module>
    from pyecharts import Geo  #地理图
ImportError: cannot import name 'Geo' from 'pyecharts' (D:\Program Files (x86)\Python 3.8.1\lib\site-packages\pyecharts\__init__.py)

python爬取前程无忧招聘网站数据及可视化分析

修改为

from pyecharts.charts import Geo  #地理图

最新抓取的解析方式有问题导致没法得到数据,请自行根据html dom格式解析


打赏

文件名:python爬虫.zip,文件大小:3733.17K 下载
  • /
      • /python爬虫
        • /python爬虫/apridata.csv
        • /python爬虫/data.csv
        • /python爬虫/datamining.csv
        • /python爬虫/test5.py
        • /python爬虫/test5_2.py
        • /python爬虫/test5_3.py
        • /python爬虫/test6.py
          • /python爬虫/清洗及可视化
            • /python爬虫/清洗及可视化/data.csv
最代码最近下载分享源代码列表最近下载
caoyang  LV7 8月6日
lhz057  LV7 6月14日
Trickster  LV8 5月17日
cqlpljs  LV1 4月28日
小最迷弟  LV3 4月8日
宁123455  LV3 4月1日
时不知归  LV3 3月28日
leimua  LV1 3月14日
muzi111  LV1 3月12日
最代码最近浏览分享源代码列表最近浏览
caoyang  LV7 8月6日
nyfcalf  LV12 7月29日
mwb  LV5 7月25日
qwqw900619  LV2 6月27日
hajra9  LV1 6月27日
admintet 6月17日
暂无贡献等级
暂无贡献等级
hhhhhz  LV4 6月17日
agjbvfhjbg  LV4 6月9日
zhoujianyi  LV3 6月2日
顶部 客服 微信二维码 底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友