云企网络logo
云企网络微信号

扫一扫微信二维码

云企分享专用缩略图

爬行、抓取、索引、收录各指的是什么

2019-12-11  当前栏目:云企资讯

很多SEO并没有理解爬行、抓取、索引、收录这些概念到底指的是什么?了解这些概念对我们针对性的做网站seo优化是很有帮助的。接下来一起来看看它们分别指的是什么吧!

首先需要了解蜘蛛工作三部曲

①爬行抓取:爬行、抓取;②数据处理:过滤、收录;③查询系统:索引、排序;

爬行是什么?

爬行指的是搜索引擎蜘蛛从已知页面上解析出链接指向的URL,然后沿着链接发现新页面(也就是链接指向的URL)的过程。当然,蜘蛛并不是发现新URL马上就爬过去抓取新页面,而是把发现的URL存放到待抓地址库中,蜘蛛按照一定顺序从地址库中提取要抓取的URL。

蜘蛛爬行的方法

1、深度优先

2、宽度优先:链接跟踪策略

3、权重判断:低权重宽度优先、高权重深度优先、链接层次、外链数量和质量

4、重访抓取

网站的层级最好控制在三层,超过四层和五层则很可能有不会爬行的机会很大,链接层次一定要精简。

抓取是什么?

抓取是搜索引擎蜘蛛从待抓地址库中提取要抓的URL,访问这个URL,把读取的HTML代码存入数据库。蜘蛛的抓取就是像浏览器一样打开这个页面,和用户浏览器访问一样,也会在服务器原始日志中留下记录。

怎么加快搜索引擎的抓取?

①保持您的网站快速。您的网站越慢,抓取的时间就越长。

②您的站点应具有一个或多个XML站点地图。这些XML站点地图告诉百度您网站上存在哪些网址。一个好的XML站点地图还会指示您上次更新特定URL的时间。大多数搜索引擎会比其他搜索引擎更频繁地抓取XML站点地图中的URL。

索引是什么?

索引指的是将一个URL的信息进行整理,存入数据库,也就是索引库,用户搜索时,搜索引擎从索引库中提取URL信息并排序展现出来。索引的英文是index。索引库是用于搜索的,所以被索引的URL是可以被用户搜索到的,没有被索引的URL用户在搜索结果中是看不到的。

收录是什么?

收录是从搜索用户角度看的,搜索时能找到这个URL,就是这个URL被收录了。从搜索引擎角度看,URL被收录了,也就是这个URL的信息在索引库中存在。英文并没有收录这个词,和索引用的是同一个词index。

那如何提高索引量以及收录?

一、网站内容质量要高

要想被搜索引擎判定为是有用的页面,从而建立索引,那么首先网站的页面的内容一定是对搜索引擎、对用户都是有价值的。所以要想有效增加网站索引量,高质量的内容是关键。

二、网站内链布局合理得当

一般网站内链建设与我们网站的相关性越高,就越容易被搜索引擎收录,而且用户的体验也会比较好,容易带来更多的页面点击,有效增加用户的黏性。所谓的相关性是指站长在做优化的时候,要对用户进行深入的分析,还是老话常提的以用户思考问题的方式去做优化,抓准用户的心理、弱点,持续提供有吸引力的内容,让用户愿意浏览我们的页面。

三、高质量外链发布

以上有了质量好的内容和合理的内链布局,而还缺重要的一步,当然不够,闭门造车、守株待兔式的等待蜘蛛来抓取网站显得有些太过被动,如何将高质量的内容推送给搜索引擎这时候就显得尤为重要。因此外链的意思其实就是在互联网上别人的网站上放置指向我们网站的链接,吸引更多蜘蛛顺着这个线索爬向我们的网站。(部分内容摘自17年经验老司机Zac的SEO每天一贴,中文SEO优化行业旗帜性博客)


如需转载请保留本文链接:http://www.yunxiaoguo.com/html/zs/39.html

 

首页
电话咨询
在线咨询