当前位置:网站首页 > SEO技术 > 正文

seo是指搜索引擎优化(搜索引擎的基本原理)

三石哥三石哥 2023-01-01 21:01:58 118

SEO必看 ,搜索引擎的工作原理及优化

一、搜索引擎工作原理

搜索引擎的工作分为三个阶段,即爬行,索引和检索

1.爬行

搜索引擎具有网络爬虫或蜘蛛来执行爬网,每次抓取工具访问网页时,它都会复制该网页并将其网址添加到索引中。

在“蜘蛛”抓取网页内容,提炼关键词的这个过程中,就存在一个问题:“蜘蛛”能否看懂。如果网站内容是 flash 和 js,那么它是看不懂的。

相应的,如果网站内容是它的语言,那么它便能看懂,它的语言即 SEO

2.索引

此阶段,爬网程序会创建搜索引擎的索引。索引就像一本巨大的书,其中包含爬虫找到的每个网页的副本。如果任何网页发生更改,则抓取工具会使用新内容更新图书

3.检索

这是搜索引擎以特定顺序提供最有用和最相关答案的最后阶段。

二、SEO 简介

1.SEO 的分类

A.白帽 SEO:起到了改良和规范网站设计的作用,使网站对搜索引擎和用户更加友好,并从搜索引擎中获取合理的流量

B.黑帽 SEO:利用和放大搜索引擎政策缺陷来获取更多用户的访问量

2.白帽 SEO 的使用

a.对网站的标题、关键字、描述精心设置,反映网站的定位,让搜索引擎明白网站是做什么的;

b.网站内容优化:内容与关键字的对应,增加关键字的密度;

c.在网站上合理设置 Robot.txt 文件;

d.生成针对搜索引擎友好的网站地图;

e.增加外部链接,到各个网站上宣传;

三、SEO 优化

通过网站的结构布局设计和网页代码优化,使前端页面既能让浏览器用户能够看懂,也能让“蜘蛛”看懂。

1.网站结构布局优化

A.控制首页链接数量

对于中小型企业网站,建议首页链接在100个以内,链接的性质可以包含页面导航、底部导航、锚文字链接等

B.扁平化的目录层次

尽量让“蜘蛛”只跳转3次,就能到达网站内的任何一个内页

C.导航优化

导航应该尽量采用文字方式,也可以搭配图片导航,但<img>标签务必添加“alt”和“title”属性,告诉搜索引擎导航的定位

seo是指搜索引擎优化(搜索引擎的基本原理)

其次,在每一个网页上应该加上面包屑导航

seo是指搜索引擎优化(搜索引擎的基本原理)

对用户而言,可以让用户了解当前所处的位置,形成更好的位置感,并方便用户操作;

对蜘蛛而言,能够清楚的了解网站结构,同时还增加了大量的内部链接,方便抓取,降低跳出率。

D.结构布局的规范优化

a.页面头部:logo 及主导航,以及用户的信息

b.页面主体:左边面包屑导航及正文;右边放热门文章及相关文章,既增强了页面相关性,也增强页面的权重

c.页面底部:版权信息和友情链接

注意:分页导航推荐写法:“1 2 3 4 5 6 7 8 9 10 下拉框/输入框”,这样“蜘蛛”能够根据相应页码直接跳转,下拉框直接选择页面跳转

seo是指搜索引擎优化(搜索引擎的基本原理)

E.控制页面的大小

一个页面最好不要超过100k,太大,页面加载速度慢,用户体验不好,并且一旦超时,“蜘蛛”也会离开。

2.网页代码优化

a.<title>

标题,强调重点即可,尽量做到每个页面的 <title> 标题内容不重复

seo是指搜索引擎优化(搜索引擎的基本原理)

b.<meta keywords>

关键词,列举出几个页面的重要关键字即可

seo是指搜索引擎优化(搜索引擎的基本原理)

c.<meta description>

网页描述,高度概括网页内容的关键词,每个页面也要有所不同

seo是指搜索引擎优化(搜索引擎的基本原理)

d.标签语义化

比如:h1-h6是用于标题类的,<nav>标签是用来设置页面主导航的等

e.<a>标签

页内链接,要加“title” 属性加以说明,让访客和 “蜘蛛” 知道;

外部链接,链接到其他网站的,则需要加上 el="nofollow" 属性,避免“蜘蛛”爬了外部链接之后,就不回了

f.正文标题要用 <h1> 标签

“蜘蛛” 认为它最重要,若不喜欢<h1>的默认样式可以通过CSS设置

g.<br>

只用于文本内容的换行

seo是指搜索引擎优化(搜索引擎的基本原理)

h.<caption>

表格应该使用 <caption> 表格标题标签

i.<img> 应使用 “alt” 属性加以说明

j.<strong> 和 <em> : 需要强调时使用

<strong>标签在搜索引擎中能突出关键词

<em>标签强调效果仅次于 <strong>

而 <b>、<i>标签: 只是用于显示效果时使用,在 SEO 中不起效果

k.避免使用 和 ©

空格符 应用 CSS 进行设置

版权符 © 可以直接使用输入法打“©”

l.少用 iframe 框架,因为“蜘蛛”一般不会读取其中的内容

m.少用 display: none;

对于不想显示的文字内容,应当设置 z-index 或设置到浏览器显示器之外。因为搜索引擎会过滤掉 display:none 中的内容

浅谈搜索引擎的工作原理

前面2期介绍SEO的时候就讲到了关于SEO的基本定义,这里再次简单回顾下吧!

seo是指搜索引擎优化(搜索引擎的基本原理)

SEO(搜索引擎优化)

SEO(搜索引擎优化)通常定义为:在了解搜索引擎的工作原理基础上,对网站进行内外调整优化,提高网站关键词排名,获得更多流量,达成网站的营销目的。通过这一定义,我们可以看到,做SEO首先需要知道我们搜索引擎的工作原理是怎样的,只有搞清楚它的原理,我们才可以本着这一原理进行做后期优化工作。这就是今天这一期重点和大家分享的话题:搜索引擎的工作原理!

由于搜索引擎这一块的专业知识涉及很广,可以单独作为一门学科来系统化学习的,所以建议新手刚开始学SEO的时候可以先多学习下搜索引擎这一块知识哦,也可以自己买本搜索引擎原理的书籍看看也行,只有理解了搜索引擎的工作原理后,我们对后期优化工作才有了明确的方向!

seo是指搜索引擎优化(搜索引擎的基本原理)

搜索引擎的工作原理

首先搜索引擎的工作原理大体上分为三个阶段:

  1. 爬行与抓取:搜索引擎蜘蛛(Spider)通过跟踪链接发现和访问页面,然后读取HTML代码,存入数据库中;
  2. 预处理:搜索引擎蜘蛛抓取来的页面数据进行文字提取,中文分词,索引(正向索引),倒排索引等,以备后面排名和展现;
  3. 排名:通过一定的搜索相关性计算,按照一定格式生成搜索结果页面。

seo是指搜索引擎优化(搜索引擎的基本原理)

搜索引擎的工作原理

针对这三个阶段详细说下搜索引擎的工作原理:

爬行与抓取

1、跟踪链接:一般是深度优先和广度优先两种跟踪方式,如图所示:

seo是指搜索引擎优化(搜索引擎的基本原理)

深度优先跟踪链接

seo是指搜索引擎优化(搜索引擎的基本原理)

广度优先跟踪链接

理论上,无论是哪种跟踪方式,只要给蜘蛛足够多时间,都能爬完整个互联网上的链接,但实际上,蜘蛛的宽带资源和时间都是非常有限的,不可能爬完所有的链接,最多只能爬行和收录一小部分,所以我们做SEO工作就需要主动吸引蜘蛛来爬行和收录我们的页面。

2、吸引蜘蛛:哪些页面可以吸引到蜘蛛呢?符合以下几点就足以。

  • 第一,网站和页面权重。权重越高,蜘蛛就越喜欢,尤其是老网站,质量高的网站;
  • 第二,页面更新频率。蜘蛛喜欢新鲜事物,所以网站这一块也需要经常多跟新;
  • 第三,导入链接。无论是外链还是内链,只要多给蜘蛛爬行页面的路径,页面收录率和排名会更高;
  • 第四,与首页点击距离。一般网站首页权重最高,所以页面里首页的点击距离越近,爬行和收录机会更高;
  • 第五,URL结构。首先符合静态化最好,其次URL越短,层次越少,蜘蛛爬行的机会就更大些,页面收录机会也就更大。

预处理

这里所说的预处理包括:提取文字,中文分词,去停止词,消除噪声,去重,正向索引,倒排索引,链接关系计算,特殊文件处理以及质量判断等等,由于内容过多,这里不多做详细说明,主要讲下正向索引和倒排索引这两块核心内容,有些书籍把预处理这一阶段定义为索引,其实也是说明了正向索引和倒排索引的重点,首先看下面示意图:

seo是指搜索引擎优化(搜索引擎的基本原理)

正向索引结构

seo是指搜索引擎优化(搜索引擎的基本原理)

倒排索引结构

上图中文件就是指页面了,关键词就是与用户所搜索的词相匹配的关键词,这里的关键词是搜索引擎内部存储的关键词,也是基于过去用户所搜索过的词,进行一次收集和整理所得出来的。通过对比两种索引结构就可以看出,倒排索引更能符合搜索引擎的工作要求,当用户搜索某一关键词时候,搜索引擎系统内部便能一次性直接导出与关键词相匹配的页面,然后再通过链接相关性计算,特殊文件处理,页面质量判断得出哪些页面可以用作搜索结果页面中,最后以排名的方式显示出来。

排名

进行预处理过后,尤其是倒排索引处理之后,然后对用户搜索词处理以及相应的文件匹配,得出初始文件的子集,这里的初始文件子集并不能直接用于排名,还要进行相关性计算,排名过滤和调整,最终显示出页面的排名结果。这里的相关性计算,主要是根据关键词常用程度、词频和密度、关键词位置及形式、关键词距离、链接分析及页面权重等来得出页面的内容是否和用户搜索的词高度相关。

好了,关于搜索引擎的工作原理大致上就说这么多了,其实还有很多详细地方没有具体说到,由于涉及过广,大家可以多了解下搜索引擎这一块的内容,可以借助相关书籍来系统学习这一块的内容哦!本期的SEO分享就到这里了,大家有任何问题和想法都可以在评论下方留言咨询哦!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。

转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《seo是指搜索引擎优化(搜索引擎的基本原理)》

标签:

关于我

关注微信送SEO教程

搜索
最新文章
热门文章
热门tag
抖音提升网站排名优化百度SEO优化网站优化提高网站排名SEO优化技巧抖音小店SEO优化seo优化网站SEO优化网站排名seo网站优化seo小红书关键词优化百度SEO排名SEO优化排名关键词排名搜索引擎优化
友情链接