一直以来,百度对原创的处理都比google要好(个人认为)。我个人认为google引以为豪的PR(pageRank)体系其实是害了自己,为什么这么说是有原因的。
大家都知道,中国的站长们都比较喜欢copy,于是就出现了大量的采集站。又因为google对PR值高的站点采集更频繁,于是很多PR高的采集站变成了原创站,而真正的原创却因为被google发现得晚而被认为是转载。当然这个问题百度也有,但百度没有公开它类似于google的这个体系,所以作弊的站点相对较少。
Google最近加大了googlebot的抓取能力,加快了对新页面的收录。google的最近收录加快是不是代表从基本的收录就在解决这个问题:加快新站或者说保证所有张收录速度都是一样的,那么以收录时间来判断是哪儿的原创问题。这样的做法就是说,谁先发出,即刻给排名,后面收录的不管你是权重多高的站点,都在该原创之下。这样的话,就可以极力打击采集站点,当然,对于转载站 点来说,效果也是一样。 当然,任何东西没有十全十美,算法只是一种补充而已,中间还是可能出现转载站或者采集站偶尔高过现在的站。但如果google发现全部文章他的数据库里都 有原始的记录,说简单点,就是说存在相同的记录,那么就减缓这个站的收录。一个小小的变化就解决了比较大的问题。我觉得google算法的动机上还是考虑 了大部分站长的利益。
在中国特色的环境下,这种算法的出现无疑是一种最稳妥的解决方案。Google进入本土化运营以后,在这方面的一直在努力,不知道下次的算法更新是怎么样的惊喜。