SEO术语大全,新手入门必看77个知识要点!

SEO术语大全,新手入门必看77个知识要点!

1  搜索引擎优化(Search engine optimization,SEO)
SEO 就是根据对搜索引擎的吸引力和可见性来优化内容,从而使 Web 页面能够被搜索引擎选中。SEO 主要用来提高有机列表的排名。我使用 SEO这个术语描述我推荐的技术,但是其中许多技术也可以归入 SEM 的范畴。SEM就是通过搜索来进行的所有技术,SEO只是其中的一部分。

2  关键词(keyword)
一个特定的词或者短语,搜索营销人员希望搜索者来经常输入作为搜索请求。

3  关键字、关键词和关键短语(Keyword、keyterm 和 keyphrase)

关键字、关键词和关键短语是 Web 站点在搜索引擎结果页面(也称为 SERP)上排序所依据的词。根据站点受众的不同,您可以选择一个单词、多个单词的组合或整个短语。为简化起见,本文将使用关键词这个术语表示所有这三种类型。例如一个有资派的标题为:有资派,教育培训行业资源整合有资派。其中这包含的就是关键词。

4  关键词密度(keyword density)
也被称为搜索项密度(term density )是关于特定搜索请求的项在网页上所有项中的比率。例如,如果你想要的200 个词的网页就是关键词“失眠症”被找到,而你的网页上这个词出现了12 次,你网页上这个词的关键词密度是6%  (12/200)。搜索引擎通常认为有5-7%关键词密度的网页是很高质量的网页。

5  关键词突出程度(keyword prominence)
是一种结合术语在网页上布置和位置的衡量指标,表明其对搜索引擎的值。最突出的关键词位置是网页标题的第一个词,因为标题布置,并且是在最好的位置。

6  关键词堆积(keyword loading, keyword stuffing)
是一种作弊技术,通过它关键词被过度使用,仅仅为了吸引搜索引擎。

7  关键词布置(keyword placement)
也被称为术语布置,一种关于词语在网页上位置的价值衡量标准。所有的词语在网页上不是平等。在网页标题或者在段落标题上的词语比在正文段落中的词语更重要——这些词语的所在的位置是它度。

8  关键词排名(Ranking)
关键词排名是页面在目标关键词的 SERP 中列出的位置。SEO 的目标是提高 Web 页面针对目标关键词的排名。

9  描述标签(description )
是HTML的要素,包含了网页的大纲。搜索引擎有时候对页面描述匹配搜索请求,这样提高描述的质量可能是优化网页的好方法。

10  链接(link)
一套关键词,一个图片或者其他“带到另一个网页上。搜索引擎在爬网页的时候特别注意向关性来排名网页的时候注意向内的链接。

11  链接分析(link analysis)
也被称为链接流行程度,搜索引擎使用的技术,通过检测网页之间的网络链接来决定网页的权威程度。搜索引擎在按相关性排名搜索结果的时候也使用链接分析

12  链接工厂(link farm)
是一种作弊技术,通过它搜索营销人员建立几十个或者上百个能被搜索引擎爬

13  内在链接(interior link)
在你网站内部深层的超文本

14  内部链接(internal link)
从网站上一个网页到另一个另网页的链接,使得访客转到新的网页上。搜索引擎不看重这些链接。

15  链接农场(Link farm)
在 SEO 术语中,链接场是指一个充满链接的页面,这些链接其实没有实际作用,它们只作为链接存在,而没有任何实际的上下文。那些采用运用黑帽SEO 方法的人利用链接场,在一个页面中增加大量链接,希望能通过这种方式使 Google  误认为这个页面很有链接的价值。

16  交互链接(reciprocal link)
也称作双向链接,是对一个网页不光有超文本链接,同时对应有和原始网页的链接。

17  单向链接(one-way link)
链接到一个网页的超链接,而没有相应链接回到原来的网页。

18  反向链接(back links)
就是所说的向内链接(inbound link),指的是从一个网页到你网页的超级链接。从你站点外链到网页的向内链接,在搜索引擎做链接分析、并根据相关性来对搜索结果排序的时候有很高的价值。

19  双向链接(tow-way link)
也被称作相互链接,是对一个网页有超文本链接,同时目标网在链接回来原来的网页。

20  外向的链接(external link)
从一个站点链接到其他站点的链接,允许访客转换到新的站点上。搜索引擎会认为这些链接是发送这些链接的站点是对收到链接站点的认可。

21  向内的链接(inbound links)
也被称为反向链接,指的是从一个网页到你网页的超级链接。从你站点外链到网页的向内链接,在搜索引擎做链接分析,并根据相关性来对搜索结果排序的时候有很高的价值。

22  交互链接(reciprocal link)
也称作双向链接,是对一个网页不光有超文本有和原始网页的链接。

23  家族内链接(link within the family)
在两个有相似IP地址、或者相似数据库信息,或者定向锚文本间网站的链接可能被搜索引擎认为有偏向是在彼此中立方之间的。

24  相关的链接(relational link)
你由于业务关系而请求得到的一个进入到你站点的超文本接,这些关系例如你公司和供应商,经销商,和顾客的关系。

25  相关性(relevance)
一个自然搜索与搜索请求相关的程度。一个有极高相关性的匹配是对那个搜索请求排名第一的候选结果。搜索引擎通常使用相关性排名算法,通过配,来展示搜索结果。相关性排名算法使用多种要素,包括匹配搜索请求内容所在网页的位置,网页的权威性(基于链接分析),搜索请求中的词语在网页上彼此的接近程度,以及更多其他的。

26  PageRank(PR)
PageRank 是迷恋 Google 的人们用来测试其站点在 Google 中的排名的一种度量标准。SEO 和搜索引擎营销(SEM)专家也使用这个术语描述网页在 SERP 中的排名以及 Google 根据排名算法给予站点的分数。无论如何定义,PageRank 都是 SEO 的重要部分。

27  搜索引擎结果页面(Search engine results page,SERP)
SERP 是为特定搜索显示的列表或结果。SERP 有时候定义为搜索引擎结果的安排(placement)。根据本系列的目的,我将其称为页面而不是安排。在 SEO 领域中,在 SERP 中取得良好的表现就是一切。

28  垃圾技术(Spamming)
垃圾技术是一种欺诈性的 SEO 手段,它尝试欺骗爬行器(spider),并利用排名算法中的漏洞来影响针对目标关键词的排名。垃圾技术可以表现为多种形式,但是 “垃圾技术” 最简单的定义是 Web 站点用来伪装自己并影响排名的任何技术。根据是否采用垃圾技术,SEO 方法可分为两大类:站内SEO和站外SEO。

29  黑帽SEO(Black hat SEO)
用垃圾技术欺骗搜索引擎。黑帽 SEO 以伪装、欺诈和窃取的方式骗取在 SERP 中的高排名。

30  白帽SEO(White hat SEO)
正当方式优化站点,使它更好地为用户服务并吸引爬行器的注意。在白帽 SEO 中,能够带来好的用户体验的任何东西也都被视为对 SEO 有益。

31  临时重定向(temporary redirect)
也就是 302 重定向,一条对网站浏览的指令,用来显示与浏览器所要求显示的不同的网址,当网页网址发生短期的变化时使用。临时重定向是搜索引擎能够正确处理的一种服务器端重定向。

32  隐藏文本(hidden text)
一种作弊技术,通过这种技术,网页上的文字被设计来被蜘蛛程序而不是人看到。文本可以通过用极小的的字号显示而不被看到,或者使用和背景颜色一样的颜色,或者将关键词被图形或者其他网页元素覆盖等。作弊者在网页上堆积关键词来得到高的搜索排名。

33  谷歌跳舞(Google Dance)
谷歌跳舞这个名词通常用于描述谷歌搜索引擎对搜索结果进行更新、重组的过程。谷歌一般每个月对其搜索数据库进行一次更新。新的网页被加入,无效网页被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。在“跳舞时期”(三到五天内),谷歌的搜索结果会有大幅度的波动,几乎每一分钟都会有变化。这一更新过程可以很容易地通过搜索结果的显著变化来识别。“跳舞”一般持续几天时间,跳舞结束后,Google搜索结果和网站外部链接数量趋于稳定,直至下一个周期的到来。

34  搜索结果(search result)
作为对搜索者的搜索请求的响应,搜索引擎返回匹配网页的链接,这个链接就是搜索结果。搜索引擎使用多种技术来断定哪个网页与哪个搜索请求匹配,并且根据相关程度来对自然搜索匹配结果进行排名,见最匹配的结果呈现在第付费放置和目录结果通常同时受到相关性以及网站所有者竞标结果的影响。

35  站点地图(sitemap)
一个对蜘蛛程序友好的网页,它提供了指向网站域里面其他网页的链接。对一个小型网站而言,站点地图提供直接链接到站点上所有网页的链接。中到大型站点使用站点地图链接到域里面主要的中心网页(这些网页会最终依次实现对站点上所有网页的http://youzipai.org访问)。

36  作弊(spam)
1.非索要的不合法电子邮件,通常包含商业信息或者欺诈性的主题,未经允许就投递给收信人。
2.也被称为搜索作弊技术,被网站设计来愚弄搜索引擎的不道德(但是合法)技术,即使其网页对一搜索请求不是最佳匹配,也会得到显示。

37  超搜索引擎(metasearch engine)
一个搜索引擎将很多搜索者的输入的搜索请求发到其他很多搜索,比较每个搜索引擎的结果并显示在单一的结果列表上。

38  301重定向(permanent redirect)
也被称为永久重定向,是一条对网站浏览器的指令,来显示浏览器被要求显示的不同的 URL,当一个网也经历过其 URL 的最后一次变化以后时使用.一个永久重定向是一种服务器端的重定向,能够被搜索引擎蜘蛛正确地处理。

39  永久重定向(permanent redirect)
也被称为 301 重定向,是一条对网站浏览器的指令来显示浏览器被要求显示的不同的 URL,当一个网页经历过其 URL 的最后一次变化以后时使用。一个永久定向是一种服务器端的重定向,能够被搜索引擎蜘蛛适当地处理。

40  302 (temporary redirect)
重定向 也被认为是暂时重定向,一条对网站浏览器的指令来显示浏览器被要求显示的不同的 URL,当一个网页经历过短期的 URL 的变化时使用。一个暂时重定向是一种服务器端的重定向,能够被搜索引擎蜘蛛正确地处理。

41  权威性站点(Authorit)
网站所被认为的专业水平,通常用其向内超链接的网络来衡量。搜索引擎通常对那些从其他人被很好链接的站点获得向内链接的网站给予高度的重视,并对匹配站点主题的搜索请求,将这些站点放在搜索结果的前面。

42  权威性网页(authority page)
就是某个主题有很多链接所指向的网页。

43  隐藏的链接(hidden links)
一种作弊技术,通过它超级链接被设计来被蜘蛛来访问,而不能被人发现。作弊者从很多高排名的链接到他们想要推进的网页上。

44  隐藏文本(hidden text)
一种作弊技术,通过这种技术,网页上的文字被设计来被蜘蛛程序而不是人看到。文本可以通过用极小的的字号显颜色,或者将关键词被图形或者其他网页元素覆盖等。作弊者在网页上堆积关键词来得到高的搜索排名。

45  伪装(cloaking)
也被称为 IP 发送(IP delivery),一种作弊技术,对同样的 URL,设计一个程序来返回给真实的访客的网页,以及一个不同版本 —-一个满是关键词的网页,后面这个网页被设计来得到更高的搜索排名。术语“掩饰”来自网站主人访客通过查看他们的 HTML 编码而了解他们的搜索优化机密。

46  爬行(crawler)
就是蜘蛛程序(spider),是搜索引擎的一部分,负责在互联网上定位和索引每个网页,这样就能够响应搜索者的搜索要求。成功的搜索引擎营销依赖于爬在一个网站上找到几乎所有的网页。

47  目标页面(destination page)
依据网页的领结理论,从核心网页链出的网页,它并不自己链回到核心网页。目标网页通常是高质量的页面,但它们可能是公司网站的部分,更多地的有内部链接而不是外部链接。

48  目录(directory)
有成百上千个主题的名单(如飞鱼或者是花边)以及很多与这个主题相关的链接。雅虎是目录最著名的例子,但是大多数的目录比起文本

49  目录列表(directory list)
关于一个特定主题很多超链接之一。站点的主人发送网页请求它被列在目录里面,并且在他们的提交被接受以后会告诉他们有了“目录列表”。雅虎以及放目录是最著名的网站目录的例子。

50  有机列表(Organic listing)
有机列表是 SERP 中的免费列表。有机列表的 SEO 通常涉及改进 Web 站点的实际内容,这往往是在页面或基础架构级别进行的。

51  门户网页(doorway page ,gateway page, entry page)
是一种作弊技术,通过它,一个网页被专门用于得到高的搜索排名,而对站点的访客没有任何价值。和搜索登陆页面不同,一个门户网页通常尽量保持对浏览网站访客的隐藏。

52  匹配页(match)
一个被搜索引擎建立的响应搜索请求网页。搜索引擎使用不同的技术来决定哪个网页匹配哪个搜索请求,并且按照相关性对网页排序,这样最好的匹配页会最先出现。

53  MEAT更新重定向(meat refresh redirect)
在你 HTML区段的 mega tag,指示浏览器与输入不同的 URL (例如 )。这种标签闪现在屏幕上(在这个例子中是 5秒),之后才展现新的 URL。不好的是,这种技术通常会被搜索蜘蛛程序忽略,所以尽量避免使用它。

54  索引(indexing)
是蜘蛛程序存储互联网上每个词以及对应网页位置的过程。搜索索引库是最主要的搜索引擎数据库,并且没有哪个搜索引擎不具备一个精心设计的索引库。有时也称为收录。

55  索引库(index)
搜索引擎有的网站上所有词的列表,以及每个词在哪个页面上。当搜索者输入了一个搜索请求,搜索引擎在搜索索引库中寻找搜索请求,并定位含有这些次的网页。搜索索引库是搜索引擎的主要数据库,并且没有哪个搜索引擎不具备一个精心设计的索引库。

56  沙盒效应(sandbox effect)
搜索营销专家所使用的非正式名字,用来描述 Google 和其他搜索引擎处理新站点的方法。它们会对那些链接流行度迅速攀升的网站进行冷处理。网页可以展现它要的内容,但会被放在“沙箱”里面,而对任何搜索请求都不会得到最高排名其后来的流行度经过一段时间还保持不变,或者逐渐上升,那么搜索引擎就开始取消冷处理并且给链接流行度更高的权重,使得搜索排名上升。

57  排名(ranking)
搜索引擎所使用的技术来拣选匹配网页,生成搜索结果页面。有些搜索引擎是按日期拣选搜索结果,而大部分的搜索引擎是按照相关性排名。决定最终排名执行的软件代码被称为排名算法,并且它是每个搜索引擎公司的核心商业机密。

58 自然排名
与付费和广告无关,只是依靠页面本身相关性、重要性而出现在搜索引擎结果页面的排名。在一个搜索引擎结果页面上,广告或付费排名通常都有推广、赞助商链接之类的名称,自然排名则没有这些标记。

59  内部优化
或者称为页面上的优化,指的是在网站页面上进行完全由站长自己所控制的SEO。如页面Meta标签的撰写和修改、网站结构和内部链接的优化等。

60  排名算法(ranking algorithm)
是用来控制搜索匹配怎样精确地按照顺序排布在搜索结果页面的软件。搜索匹配有时候被按照页面生成的日期来排名,而大多数排名是按照相关性。搜索引擎的相关性排名算法是每个搜索引擎公司的核心商业机密。

61  排名要素(ranking checker)
一个自然搜索匹配的任何特性都能够被排名算法用来为搜索结果网页的生成拣选匹配。相关性排名算法使用了很多种的要素,包括与搜索请求相匹配的网页的位置,网页的权威性(基于链接分析),在搜索请求中的不同词以及它们在页面上的接近程度,等等。

62  相关性排名(relevance ranking)
一种技术,被搜索引擎利用拣选匹配,来产生一系列的自然搜索结果,这些最高的匹配结果与搜索请求的相关性最接近。决定具体相关性排名是怎样执行的软件代码被称为排名算法,并且这些算法对每个搜索引擎而言是其商业秘密。相关性排名算法使用很多种要素,包括匹配搜索请求内容所在网页的位置,网页的权威性(基于链接分析),搜索请求中的词语在网页上彼此的接近程度,以及更多其他的。

63  Robots
对蜘蛛程序不常用的名字,是搜索引擎的一部分来定位和索引互联网上的每个可能回答搜索请求的网页。通常只在讨论 robots HTML 标签或者 robots.txt文件的时候使用。

64  蜘蛛程序(spider)
就是爬行程序,是搜索引擎的一部分,负责在互联网上定位和收这样能够响应搜索者的请求。成功的搜索引擎营销取决于爬的网页

65  蜘蛛程序通道(spider paths)
是用于站点导航的轻松通道,例如站点地图,分类地图,国家地图,或者在关键网页底部的文本链接。蜘蛛通道包括任何能使蜘蛛程序轻松找到你有网页的方法。

66  蜘蛛程序陷阱(spider trap)  
蜘蛛程序陷阱是阻止蜘蛛程序爬些网页显示的技术方法,这些手段能很好地配合浏览器,但对蜘蛛程序就构成了阻碍。蜘蛛陷阱包括 Javascript 下拉菜单以及有些种类的重定向。

67  标签(tag)
一种在文件在中有明确含义的标记文本的方法,目的是使计询能够更加方便。诸如 HTML 的标识语言允许内容作者通过指明文件要素的标签来“部分的文本 )确定了网页的标题。

68 图片Alt属性(Image ALT Text)
指的是网页上的图片因为某种原因不能被显示时应该出现的替代文字.代码方式
图片是不被搜索引擎识别的,其识别方式就是依靠Alt标签

69 网站快照(Cache)
搜索引擎数据库中心记录的页面内容拷贝。搜索引擎在结果中给出“网页快照”(或其他类似称呼)链接后,用户点击后看到的就是搜索引擎数据库中的页面内容。用户因为某种原因不能访问原始网页时,可以查看网页快照里的内容作为参考。

70 页面劫持(Page Hijacking)
页面劫持是一种SEO作弊手法。指的是黑帽SEO使用各种手段,将本来应该访问的页面A的用户转向到另一个页面B。302转向经常被用来实现页面劫持的手 段。作弊者在自己的网站页面A上做302转向到其他网站上的页面B。由于某种万年历,搜索引擎把页面A当做原始页面,在搜索引擎排名中出现,用户点击结果A后,作弊者在A网站上通过程序把用户转向到完全无关的页面上。所以说页面劫持实际上是利用了其他网站上的高质量内容,用户却被劫持到自己的作弊网站之上。

71 域名权重
一个域名在搜索引擎上的排名的综合实力。域名权重是很多因素的总和,包括域名种类、历史、内容原创性链接关系等。

72 蜘蛛(Spider,Bot, Crawler)
也称为机器人。指的是搜索引擎运行的计算机程序,沿着页面上的超链接发现和爬行更多页面,抓取页面内容,关入搜索引擎数据库

73 蜘蛛陷阱(Spider Trap)
蜘蛛陷阱指的是由于网站内容结构的某种特征,使搜索引擎陷入无限循环,无法停止爬行。最典型的蜘蛛陷阱是某些页面上的万年历,搜索引擎可以一直单击下一个月陷入无限循环。

74 中文分词
这是中文搜索引擎特有的过程,指的是将中间没有空格的、连续的中文字符序列,分隔成一个一个单独的、有意义的单词的过程。在英文拉丁文文字中,词与词之间有空格自然区隔,所以没有分词的必要。而中文句子包含很多词,词之间没有自然分隔,搜索引擎在提取、索引关键词及用户输入了关键词需要进行排名时,都需要先进行分词。

75 Cloaking-障眼法
障眼法中文解释是:遮蔽或转移别人视线使其看不清真相的手法。SEO中的Cloaking-障眼法是什么意思呢?指对某一个网页制作了两个版本,让搜索引擎和浏览者分别看到不同的网页内容(采用识别访问者身份的技术)。搜索引擎抓取这个网页时,获得的是纯粹为了优化某些关键词而组织的内容,而网页浏览者看到的是另一个截然不同的内容。Cloaking-障眼法是典型的SEO作弊,搜索引擎一旦识别就会对网站进行严厉惩罚。

76 灰帽SEO (Greyhat SEO)
灰帽SEO是介于黑帽SEO与白帽SEO之间,比较有争议性的SEO手法,比如链接买卖和站群等。这些手法既可能有益于用户,并遵守搜索引擎规则,也可能 被滥用来进行欺骗性的排名。(盔帽SEO在百度的2012年10月23日推出的新算法中,被彻底的送进黑幅系统,即买卖链接以及站群式推广的打压)

77 锚文字(Anchor Text)
也就是链接文字,页面上超链接中可以点击的那段文字(延伸:带有链接的锚文字叫锚文本)。锚文字对于当前页面及被指向的页面主题都有很强的提示作用。对SEO有很大的帮助。代码:< a herf=”http://youzipai.org”>这里就是锚文字</a>

SEO术语大全,新手入门必看77个知识要点!

百度收录永远是SEOer着讨论的关键话题,在网站优化战争中,稳定的收录直接影响了网站的流量、收入。为何网站首页快照更新很快,可就是不收录内页?相信许多朋友与我一样在寻找问题的答案。本文跟小贱探讨下网站内页百度不收录的原因分析与对策。(关注输赢:lizhishare)

原因1:百度已经索引了但还未放出来排名。

百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。

对策:我们要做的就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,会有惊喜的。

原因2:robots设置问题导致内页不受引擎蜘蛛爬行索引

对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。

原因3:文章原创度问题.

头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。

对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。

原因4:网站内部链接存在问题.

比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。

对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。

原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。

对策:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少懂歪脑筋,百度一有动作就没很难挽回了!

原因6:服务器无法访问,速度缓慢、被挂马等情况。

百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。

对策:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪。

新站如何被百度快速收录?

SEO术语大全,新手入门必看77个知识要点!

那如何通过使用百度链接提交工具快速的收录我们的新站呢?

在介绍链接提交工具之前,最先开始做的就是在百度站长平台对新站点进行验证,只有验证成功后我们才能使用百度站长平台的链接提交工具以及其他的更多工具。验证新站点的基本流程如下:

1、登录百度站长平台后,选择左侧“我的网站”栏目目下的“站点管理”选项,然后右侧点击“增加网站”如下图:

SEO术语大全,新手入门必看77个知识要点!

2、这时,跳到添加网站的环节中,分为两步,一是输入你新站的域名,再进行对网站的验证工作,如下:

SEO术语大全,新手入门必看77个知识要点!

上图中,重点需要说明一下,如红框中的文字,最好是验证我们的主域名(像www.zhaopin.com这种)这样后续再添加二级域名的时候直接选择子链添加即可,不用再对网站进行验证。另外如果主域名是vip站点,该子域名也会继承主域名的vip权限。否则就要单独进行验证,也不会有这种vip权限继承的能力。输入主域名之后我们直接点击下一步,选择我们验证网站的方式(文件验证、HTML标签验证、CNAME验证),并按照说明部署到我们的站点,点击验证按钮。

当网站通过验证之后,我们就可以使用链接提交工具了,目前链接提交工具分为自动提交和手动提交两大块,手动提交顾名思义自己手动复制粘贴去提交,相对简单,我就不做过多说明。而自动提交中又分为:sitemap、主动推送、自动推送三种方式。三者都是将站点自身的URL自动推送至百度,而后等待百度爬虫进行对页面的抓取。最终的目的是一样的。如果对这三种自动推送的安装方式不熟悉的话,可以参考该链接(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=2)进行配置安装。重点聊一下三者的注意事项和区别:

Sitemap提交:

在配置sitemap文件时,无论是txt格式的文本文档还是还是xml格式的文件。都不建议将其sitemap的文件名命名为sitemap.txt或sitemap.xml这么大众化且谁都能够知道的文件名。如果你这样设置,你的竞争对手或需要你网站内容的人很容易就能拿到你所有的页面url。出于保险起见还是使用一些自己定义的较复杂的文件名。每一个url都必须包含http://,文件中包含的url不得超过5万条,单文件大小不得超过10MB,一个站点最多提交5万个sitemap文件,超出5万个不再处理并会提示“链接数超”。如果是通过子域名的形式验证的站点。那么主域名下的sitemap文件是可以包含该域名下的所有域名的url的。

主动推送:

对比sitemap而言在及时抓取上推送更快、发现更快、抓取更及时。如果是时效性文章不排除其收录速度达到一瞬间的效率,这里特别建议一下,最好是主动推送我们网站第一时间产生的新内容给百度其效果更佳;主动推送是有推送数量的限制,尽可能的不要推送重复的内容给百度。这样会大大浪费自己的可推送资源。

自动推送:

是我们将一段js代码部署到我们的每一个网页中,当有用户进行访问时,触发了这段代码,这段代码自动将当前页面的url推送给了百度。需要注意的是这段代码无论是在PC站还是在移动站均可使用。是一个非常及时、便捷的轻量级链接推送工具。

当然,为什么三者建议一起使用呢?

Sitemap、主动推送、自动推送的区别:

sitemap是一个可以容纳大体量、历史数据的容器。它将我们网站所有的url装在了里面。个人觉得快速的抓取并不完全指望sitemap的提交方式,但对于已经产生的文章、现有的列表页、tag标签页等都是最佳的选择,当我们的页面发生变化时,主动推送并不一定会再次推送,因为毕竟主动推送承担更多的是对新产生页面的及时推送,最重要的是有最大推送数量的限制;再说自动推送。如果你对历史页面进行了修改,没有被访问。那么根本不会触发自动推送js代码,当然也就不会推送给百度。所以,归其根本,sitemap是对已经产生的文章页、现有的列表页、tag标签页最大的助推工具。

主动推送,虽然有推送数量上的限制,但我们推送后的抓取速度已经通过智联招聘的新站例子很好的诠释了。所以主动推送更多的应该承担对新产生的URL的及时推送作用。

自动推送,页面被访问了,就会被推送过去。那么被访问的和没被访问的就是热门页面或冷门页面的概念。冷门没被访问我们有sitemap,以及冷门页面产生时的自动推送。但对于热门页面,用户都喜欢的页面而言。在搜索引擎上也会有很大的需求,这类页面是我们获得流量的重要页面,他们如果没有被收录,除了sitemap、主动推送外,还可以更频繁的利用自动推送进行推送。这样被抓取或者收录的几率又会大多少呢?而且这个相对sitemap和主动推送实现的成本更低些,加段代码就搞定,何乐而不为呢?

所以,综合上述的案例也好,三者的区别也罢。强烈建议你将其三个自动推送工具进行安装,并让三者协同工作,将抓取和收录价值最大化。

 

来源:输赢

作者:输赢

本文由一恒传媒发布,不代表一恒传媒立场,如若转载,请注明出处:http://www.yihengsem.com/433.html

chat_bubble_outline 联系我们

联系我们

在线咨询:点击这里给我发消息

邮件:824930179@qq.com

工作日:9:30-18:30,节假日休息

微信联系
微信联系
返回顶部