Sign in

Member Benefits

Get Demands

View Business Cards

Exclusive Service

Noble Identity

AS LOW AS 1.5U /DAY

搜索引擎的工作原理和常用的高级搜索指令-《seo实战密码》读书笔记-第二篇

Share

2023-02-21

搜索引擎的工作原理和常用的高级搜索指令


这一篇主要介绍搜索引擎的工作原理和常用的高级搜索指令,对于我们深入了解seo和灵活使用搜索引擎。


虽然很多人喜欢的内容是——


“你就告诉我,怎么三下五除二,能把网站优化到第一页就行了,不要给我扯这些花里胡哨的”。


但我觉得这一章其实是很有必要的。在深入了解搜索引擎的工作原理之后,我们才能从宏观层面有个大概的操作思路,授之于鱼不如授之以渔。


不啰嗦了,我开始啦~



2.1搜索引擎与目录


对于现在的人来说,已经很少用到目录网站,典型的类似hao123,http://265.com等,网站上面有许许多多的人工搜集并整理的网站。在早期,许多seo资料把目录也称为搜索引擎的一种,其实这是不准确的。


搜索引擎是由蜘蛛程序沿着链接爬行,抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框内输入查询词后,搜索引擎排序程序从数据库中挑选出符合查询词的页面。蜘蛛的爬行,页面的收录以及排序都是自动处理的——这就是搜索引擎和目录网站最大的区别。





2.2搜索引擎工作原理简介


搜索引擎的工作过程可分为三个阶段


爬行和抓取:搜索引擎蜘蛛通过跟踪链接发现和访问网页,读取页面html代码,存入数据库。


预处理:索引程序对抓取来的页面数据进行文字提取、中文分词、索引、倒排索引等处理


排名:用户输入查询词后,排名程序调用索引库数据,计算相关性,然后按一定格式生成搜索结果页面。



从搜索引擎的原理上来分析,我们想做的事情就是,第一,吸引蜘蛛,尽可能地让蜘蛛爬行我们的页面,第二:要注意网站或网页的结构优化,有利于蜘蛛爬行,才会尽可能让我们网站更多的页面被收录。


想要吸引蜘蛛来爬取,要做好以下几点:


网站和页面权重的提升


页面经常更新


每个页面都有导入链接


与首页的点击距离不能太远


url短,层次浅



2.3用户怎样浏览和点击搜索结果


当用户在搜索框输入一个关键词,搜索引擎给出了搜索结果,那么用户会点击哪一个呢?


从大量的研究可以得出以下的结果:


排名第一的结果获得了大概40%的点击率


排名第二的结果获得了大概11%的点击率


排名第三的结果获得了大概8%的点击率


排名靠后的结果点击率逐渐下降,第二页的结果则断崖式下降。



虽然不同的行业,不同的关键词会使得这个结论有一定的差异,但是我们依然能得出一些对我们有用的结论:


第一和第二名流量差异巨大,第二页和第一页的流量差距也很大;


有时候我们可以找到网站有哪些关键词排名在第二位,想办法提高到第一位,,能使流量提升好几倍。第二页优化到第一页也是同理。





2.4常用的高级搜索指令


双引号:完全匹配搜索


释义:搜索结果返回的页面包含双引号中出现的所有词,连顺序也必须完全匹配。


如:“飞机微博图片”


指令支持:谷歌和百度都支持



减号


释义:搜索不包含减号后面词的页面。使用时,减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。


如:新加 -坡


指令支持:谷歌和百度都支持



星号


释义:常用的通配符。


如:郭*纲,其中*代表任何文字。


指令支持:谷歌支持,百度不支持



inurl:


释义:用于词搜索查询词出现在url中的页面。由于关键词出现在url中对排名有一定影响,因此使用inurl:搜索可以更准确地找到竞争对手


如:inurl:搜索引擎优化


指令支持:谷歌支持,百度不支持



inanchor:


释义:指令返回的结果是导入链接锚文字中包含搜索词的页面。


如:inanchor:点击这里


返回的结果页面本身不一定包含“点击这里”四个字,而是指向这些页面的锚文字中出现了“点击这里”这四个字。


链接锚文字是关键词排名因素之一,有经验的seo会尽量使外部链接锚文字中出现一定次数的目标关键词。使用inanchor:指令可以找到某个关键词的竞争对手,而这些对手往往都是做过seo的。


指令支持:谷歌支持,百度不支持



intitle:


释义:指令返回的是页面title中包含关键词的页面


如:intitle:搜索引擎优化


title是页面优化的重要因素,使用intitle指令找到的文件都是更准确的竞争页面。如果关键词只出现在页面却没有在title中,说明也不是有力的竞争对手。


指令支持:谷歌和百度都支持



filetype:


释义:用于搜索特定的文件格式


如:filetype:pdf SEO


返回的就是包含SEO这个关键词的所有PDF文件


用于搜索特定的资源,如pdf电子书,word文件等非常有效


指令支持:谷歌和百度都支持



site:


释义:用于搜索某个域名下的所有文件


如:site:http://seozac.com


返回的就是seozac这个域名下的所有页面,这个指令是查询网站收录页面最有效的方法。不过这个指令不是很准确,只能作为参考。


指令支持:谷歌和百度都支持



link:


释义:用于搜索某个url的反向链接,既包含内部链接,也包含外部链接


如:link:http://seozac.com


指令支持:谷歌支持,百度不支持



高级搜索指令也是可以搭配起来使用的


如inurl:http://edu.cnintitle:交换链接


返回的则是来自http://edu.cn域名,标题中包含“交换链接”这四个字的页面,大部分应该是愿意交换链接的学校网站。


Disclaimer:
Details
HUIDU.io

GROWTH DRIVEN GLOBAL PTE. LTD. 202618650K

101 THOMSON ROAD, #28-03A, UNITED SQUARE, SINGAPORE 307591

Copyright 2026 HuiDu