rzaimx的gravatar头像
rzaimx 2019-03-02 23:02:30

python爬取前程无忧招聘网站数据及可视化分析

项目描述

从前程无忧招聘网站上进行网页抓取,提取各项数据,数据包含多个维度,分别是城市、岗位名称、公司名字、公司规模、公司类型、经验要求、学历要求、专业要求、福利待遇和所属行业等。对爬取的数据进行数据清洗及标准化后,实现数据分析和可视化。最后实践apriori算法,进行频繁项集提取及关联分析。

运行环境

python3.7  PyCharm

项目技术(必填)

python爬虫和可视化技术

是否原创(转载必填原文地址)

项目截图(必填)

python爬取前程无忧招聘网站数据及可视化分析

运行截图(必填)

python爬取前程无忧招聘网站数据及可视化分析python爬取前程无忧招聘网站数据及可视化分析

python爬取前程无忧招聘网站数据及可视化分析

python pi7.py

python爬取前程无忧招聘网站数据及可视化分析

python pi11.py

python爬取前程无忧招聘网站数据及可视化分析

python pi12.py

python爬取前程无忧招聘网站数据及可视化分析

注意事项

Traceback (most recent call last):
  File "pi1.py", line 11, in <module>
    from pyecharts import Geo  #地理图
ImportError: cannot import name 'Geo' from 'pyecharts' (D:\Program Files (x86)\Python 3.8.1\lib\site-packages\pyecharts\__init__.py)

python爬取前程无忧招聘网站数据及可视化分析

修改为

from pyecharts.charts import Geo  #地理图

最新抓取的解析方式有问题导致没法得到数据,请自行根据html dom格式解析


打赏

文件名:python爬虫.zip,文件大小:3733.17K 下载
  • /
      • /python爬虫
        • /python爬虫/apridata.csv
        • /python爬虫/data.csv
        • /python爬虫/datamining.csv
        • /python爬虫/test5.py
        • /python爬虫/test5_2.py
        • /python爬虫/test5_3.py
        • /python爬虫/test6.py
          • /python爬虫/清洗及可视化
            • /python爬虫/清洗及可视化/data.csv
最代码最近下载分享源代码列表最近下载
求学的熊猫  LV6 1月21日
tianshi  LV7 1月4日
淡凉123456  LV9 1月1日
KAIzx11  LV7 2023年12月24日
yyyy11  LV1 2023年12月16日
Yskysan  LV1 2023年12月6日
zcx12345678  LV6 2023年11月16日
lbsers  LV5 2023年11月3日
184445428  LV6 2023年4月20日
1690356080  LV37 2023年2月23日
最代码最近浏览分享源代码列表最近浏览
学生工  LV1 前天
James24  LV2 4月6日
sunlzh888888  LV28 4月6日
uid0901  LV2 4月2日
WBelong  LV7 4月2日
遗留问题  LV2 4月1日
时光无心  LV4 4月1日
暂无贡献等级
光圈3661 3月1日
暂无贡献等级
Xiehongshen0116 3月1日
暂无贡献等级
顶部 客服 微信二维码 底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友