- 所属分类:网络营销推广
- 作者: 独占网络
- 更新时间: 2015-2-10 16:08:40
- 返回列表
在网站建设的网站结构分析之前,要理解搜索引擎蜘蛛是拟人化的算法而已。算法就是按部就班的执行事先设计的抓取策略,所以良好的网站结构具备引导、分配权重、提高抓取效率等作用,只有内部框架搭建好之后,内容的布局才能井然有序,蜘蛛才能有序爬行。
一逻辑上全部爬行: 1、网站结构优化
网站物理结构,即基于内容聚合的目录及文件位置决定的结构。目前的主流思维就是网站扁平化设计,即平行结构。
主要实现方式: A、简单的上下页操作;
B、在A的基础上增加页面的选择性;
C、目前主流的列表页设计方式交流性比较合理
页的扁平化设计,页一般是权重高的页面,也是蜘蛛先访问的页面。所以在页链接对于页面的“重要性”有一定的影响,但往往一个网站的页面成千上万,页的链接数理论上维持-100-150是合理的,所以将想要频道页,详细页在页留下链接,实现逻辑上页扁平化设计。同样适用频道页等聚合属性的页面。
那么问题来了,面对数量巨大页面,如何保证都可以实现被爬行抓取?
树型结构的辅助,就是为了解决扁平化带来的不足,在导航栏,面包屑导航等设计页面层思维,辅助蜘蛛对网站结构的理解。
总体上扁平化+树型结构才是合理的网站结构优化策略组合。 2、链接结构优化
两种蜘蛛抓取不到的页面:网站本身不希望被收录的页面;没有链接到达的页面,即孤岛页面。对于没有被页推荐的页面,可以再内链上补充。合理的内链就是一个四通八达、井然有序的交通系统,蜘蛛就是来往的车辆。社会化、描文本、设置链接入口等。
3、Domain结构优化
主要是二域名和二目录的选择策略。没有的好与不好,只有适应当前发展的核心才是第重要的。所以要根据自身特点选择合理的Domain策略。
二、重要性的主导 对于搜索引擎来说,什么样的页面会被认为“更重要”?有句话是这么说的:每一个链接都是一个投票,意思是:页面的所有链接都是投票。在搜索引擎看来:获得更多内部投票的网页来说更加重要。
三、网页的标签:关键词 搜索引擎在分析页面的内容是优先从TDK入手,即title\description\keyword;之后就是H标签、ALT标签;后是TF-IDF,即词频-文件频率。从这三个关联度定义页面的“标签”,即抓取时页面定义的关键词。
如果要了解更多的信息 搜索 深圳市独占网络科技有限公司 或者 http://www.sz886.com 在线咨询了解