最代码广告位
最代码官方的gravatar头像
最代码官方2014-12-31 16:10:57

最代码网站的链接被垃圾广告链接恶意提交到百度收录后的经验和代码片段分享

今天在站长平台突然发现关键词多了很多诸如:学校,学院,办理,毕业证的不相关的关键词,估计是有seo蝗虫恶意提交了带有广告词的搜索地址给了百度,而百度也傻傻的收录了。

解决方法如下:

1.首先搜索关键词限制输入只能10个文字,超过的返回404

2.写脚本把所有这种url都收集为sitemap.xml提交到百度站长平台

最代码网站的链接被垃圾广告链接恶意提交到百度收录后的经验和代码片段分享

最代码网站的链接被垃圾广告链接恶意提交到百度收录后的经验和代码片段分享

希望能解决掉这个问题!

java脚本代码见附件

代码的思路很简单,请求地址得到链接,由于百度现在对结果链接做了加密,所以需要再次请求这个地址得到真实的地址,另外百度对客户端访问有频率限制,所以我让线程休眠3秒中。

代码写的相对啰嗦,而且java写脚本确实不如python来的快,大家可以改成为python语言的。

运行截图:

最代码网站的链接被垃圾广告链接恶意提交到百度收录后的经验和代码片段分享

缺少一个Web.java类:

class Web {
	private String home;
	private String name;

	public Web(String home, String name) {
		this.home = home;
		this.name = name;
	}

	public String getHome() {
		return home;
	}

	public void setHome(String home) {
		this.home = home;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

	@Override
	public boolean equals(Object obj) {
		Web web = (Web) obj;
		return this.getHome().equals(web.getHome());
	}

	@Override
	public String toString() {
		return "home:" + home + ",name:" + name + "\n";
	}

}

打赏

文件名:去广告链接.java,文件大小:7.611K下载
最代码最近下载分享源代码列表最近下载
wei112233 LV154月2日
月亮月亮月亮星星星星星星
luohaipeng LV232019年12月4日
太阳月亮星星星星星星
筱进GG LV382019年8月2日
太阳太阳月亮星星星星
aihui523 LV332017年8月15日
太阳太阳星星
lixl LV52016年5月10日
月亮星星
ok-wap LV182016年4月15日
太阳星星星星
56777815 LV92015年2月26日
月亮月亮星星
叶洛花开 LV22015年1月14日
星星星星
shengke LV172015年1月11日
太阳星星
gezhiling LV152015年1月7日
月亮月亮月亮星星星星星星
最代码最近浏览分享源代码列表最近浏览
LikL9420 LV119月14日
月亮月亮星星星星星星
Jacko01 LV65月18日
月亮星星星星
wei112233 LV154月2日
月亮月亮月亮星星星星星星
我的程序员 LV72月23日
月亮星星星星星星
luohaipeng LV232019年12月3日
太阳月亮星星星星星星
湮灭在路上 LV32019年11月13日
星星星星星星
不完全解释2019年10月16日
暂无贡献等级
18723450362019年9月19日
暂无贡献等级
少年阿宾 LV32019年9月18日
星星星星星星
zeyang_wang LV72019年9月5日
月亮星星星星星星
顶部客服微信二维码底部
>扫描二维码关注最代码为好友扫描二维码关注最代码为好友