来源:本站日期:2014-2-8
我们从搜索引擎蜘蛛的角度去看待一个网页,在抓取,索引和排名的时候会遇到哪些问题呢?解决了这些问题的网站设计就是对搜索引擎友好的。其实优化各种类型的网站是万变不离其宗的,搜索引擎喜欢什么就给它什么,搜索引擎不喜欢什么就不给它什么,反之会造成严
我们从搜索引擎蜘蛛的角度去看待一个网页,在抓取,索引和排名的时候会遇到哪些问题呢?解决了这些问题的网站设计就是对搜索引擎友好的。其实优化各种类型的网站是万变不离其宗的,搜索引擎喜欢什么就给它什么,搜索引擎不喜欢什么就不给它什么,反之会造成严重的后果。那么如何设计对搜索引擎友好的网站?
第一点是:搜索引擎能不能找到网页。要让搜索引擎找到你的网页就必须要有外部链接或提交百度,当搜索引擎找到网页后还必须找到网站更深的内容页,所以这就要要求网站有良好的网站结构,是符合逻辑的、扁平化的或树形结构的。而且这些页面之间要有良好的链接结构,这些链接要以文字或图片进行链接,可能有的站长喜欢用javascript链接、下拉菜单链接、flash链接等,这些如果能少用就尽量去少用,除非你的网站做的非常大,比如你可以是第二个淘宝就可以大摇大摆的去使用,为什么让站长少用这些链接呢?主要原因是因为搜索引擎无法沿着链接找到更多的网页,说白了就是蜘蛛陷阱。
这里推荐站长为网站做一个网站地图,一般来说网站都是有网站地图的,如果没有网站地图的网站建议看一下。站长在做完网站地图后可以把所有重要的部分和网页以文字链接放进去,如果网站比较大建议把网站地图分为多个,这样以来用户就可以爬行各个网页了。
第二点是:搜索引擎蜘蛛找到网页后能不能抓取。首先,要明确一点的是网页的URL必须是可以被抓取的,如果没法搜索引擎没法抓取到网页URL,那只能说明这个网站废了,所以要确保网页是否能被抓取。一般来说URL都是可以被抓取的,如果你的网页是由数据库动态生成的,那么URL要做伪静态处理,也就是说站长要去掉URL里带有问号参数之类的东西,我见过很多网站都没有去掉这类的参数,最终出现搜索引擎不信任这类URL,所以为了避免这样的现象发生最好还是做好优化。
如果你网站上有大量的flash文件,建议去掉或者做改善,经验告诉了我搜索引擎很难读取上面的内容,而且这种也称为蜘蛛陷阱。可能现在百度这块在解决读取flash信息的问题,但目前为止估计是行不通了。另外还要去避免框架结构frame,现在很少有网站做框架结构了,要记住一点千万别做,这是蜘蛛的大敌。
第三点:搜索引擎蜘蛛抓取网页后怎样提炼有用的信息。既然搜索引擎都抓取了我们的网站,那么就得让搜索引擎来提炼有用的信息,不然再怎么去抓取都是无用功的,这里我分出了几小块希望对站长有帮助:
①:网页的HTML代码必须优化,也就是格式标签占比例越低越好,真正内容占得越多越好,整个文件越小越好。
②:把CSS、javascript等放在外部文件。
③:把关键词放在应该出现的地方。
④:检查网页对不同操作系统和不同浏览器的兼容性。
⑤:检查是否符合W3C的标准,一般都符合的。
⑥:只有搜索引擎能顺利找到你的所有网页,然后抓取这些网页并提炼出其中真正有相关性的内容,这样才能被视为是搜索引擎友好的网站。