最代码官方
2014-12-31 16:10:57
原证
最代码网站的链接被垃圾广告链接恶意提交到百度收录后的经验和代码片段分享
今天在站长平台突然发现关键词多了很多诸如:学校,学院,办理,毕业证的不相关的关键词,估计是有seo蝗虫恶意提交了带有广告词的搜索地址给了百度,而百度也傻傻的收录了。
解决方法如下:
1.首先搜索关键词限制输入只能10个文字,超过的返回404
2.写脚本把所有这种url都收集为sitemap.xml提交到百度站长平台
希望能解决掉这个问题!
java脚本代码见附件
代码的思路很简单,请求地址得到链接,由于百度现在对结果链接做了加密,所以需要再次请求这个地址得到真实的地址,另外百度对客户端访问有频率限制,所以我让线程休眠3秒中。
代码写的相对啰嗦,而且java写脚本确实不如python来的快,大家可以改成为python语言的。
运行截图:
缺少一个Web.java类:
class Web { private String home; private String name; public Web(String home, String name) { this.home = home; this.name = name; } public String getHome() { return home; } public void setHome(String home) { this.home = home; } public String getName() { return name; } public void setName(String name) { this.name = name; } @Override public boolean equals(Object obj) { Web web = (Web) obj; return this.getHome().equals(web.getHome()); } @Override public String toString() { return "home:" + home + ",name:" + name + "\n"; } }
猜你喜欢
- 最代码网站被第三方垃圾广告网站恶意反链处理的经验分享和代码片段分享
- bat批量删除maven仓库中的LastUpdated文件脚本
- java脚本删除指定目录下的所有指定名称的文件夹
- 删除java文件内的注释的java脚本工具类
- 基于Spring Boot+Layui+mybatis开发垃圾分类管理系统
- mybatis批量删除(逻辑删除)
- 最代码官方网站首页静态页面
- 最代码网站中在线提醒的机制优化经验及其相关源代码片断分享
- 最代码网站用户私信列表采用mysql union查询优化为Redis查询的经验和相关代码片段分享
- 最代码网站中关于动态表event的设计思路
- java牛每日注册用户数
- java定时任务删除过期文件
请下载代码后再发表评论
相关代码
最近下载
阳15837183681 LV1
2021年4月6日
wei112233 LV15
2020年4月2日
luohaipeng LV23
2019年12月4日
低调人 LV38
2019年8月2日
aihui523 LV34
2017年8月15日
lixl LV5
2016年5月10日
ok-wap LV19
2016年4月15日
56777815 LV9
2015年2月26日
叶洛花开 LV2
2015年1月14日
shengke LV17
2015年1月11日
最近浏览
Viridity LV6
2022年5月28日
lvzhwwww
2022年5月22日
暂无贡献等级
master_guo LV7
2022年2月28日
Lcovde LV19
2021年12月22日
glqywy1 LV4
2021年10月25日
654651 LV4
2021年7月26日
啦啦啦7719 LV15
2021年4月27日
阳15837183681 LV1
2021年4月6日
喵小兵 LV10
2021年3月13日
桌子与灯 LV6
2021年2月26日