网址(URL)的SEO优化观念,一篇统整给你!

作者:码迷 阅读:246 点赞:42

网址(URL)的SEO优化观念,一篇统整给你!/

URL(Uniform Resource Locator),中文俗称为网页位址,也就是网址,用以表示资源在互联网中的位址。

其最早是由Tim Berners-Lee爵士在1994年所提出,用于万维网(World Wide Web, WWW)的位址,如今已由万维网协会(World Wide Web Consortium, W3C)编制为互联网标准RFC 1738。

在大多数的网页浏览器中,会将网页的URL展示在页面上方的网址栏。

网址的组成

我们可以将常见的网址结构,拆解如下:

http://www.example.com/folder1/index.html?product=123&color=blue#top

通信协定 - 决定了该资源在怎样的约定下发送,对包括数据格式、发送速度、发送步骤等问题做出统一的规定。常见的有HTTP、HTTPS、FTP等等。

服务器,通常为网站所注册的网域名称,有时为IP位址,网域名称是为了让人类更容易理解与记忆,而用以替代IP位址的代称,若是网域则其中可以再细分为三个部分:

子网域名称

次级域名

顶层网域(TLDs) - 可以想成是一种对网站的分类,除常见的.com .org .net .edu .gov .co .io外还有非常多种。

路径 - 用「/」作为层级或不同目录的区隔,可能包含目录、页面或文档名称

查找 - 以「?」为开头与前面的部分分开,后面的参数彼此之间不具阶层关系,参数之间以「&」分隔,参数名称与值之间再以「=」分开

分段、锚点 - 通常以#为开头,当在网址中使用,浏览器会直接滚动至插入该名称锚点的位置

URL对SEO所造成的影响?

(1)用户体验

经过妥善规画后的网址,可以同时让搜索引擎与用户轻易的理解其所链接页面的主要内容。

若是将网页标题遮住,用户仅看网址也能够大概理解在点下链接后,到达的页面大概在讲述什么内容,他所经历的就会是相对容易明了的使用体验。

(现在Google将许多网页在搜索结果中的网址以面包屑链接的形式显示网址或网站的结构,尤其是行动搜索结果,目的就是为了让用户能够更容易理解)

(2)搜索排名

尽管所占的重要程度可能并不高,但网址内的文本仍是一个搜索引擎判断网页与搜索字词关联性的其中一个因素。在网址内适当的加入关键字,只要不过度填充,仍旧是好的作法。

(3)链接

在许多时候,若是没有另外撰写锚点文本,网址就可能会作为该链接自己的锚点文本。

例如在社区媒体、论坛、博客等地方发布链接时,人么可能会透过网址内出现的字词去推测该网页的内容,若是网址易懂,可以让人比较容易了解点击链接后会出现什么样的网页内容。未经语意化的网址看起来也较为杂乱,有可能降低人们点击链接的意愿。

该使用动态网址还是静态网址?

什么是动态网址?

现在多数网站的网页是以数据库驱动,由程序产生页面,在服务器上并没有独立存在的网页文档。当用户透过网址拜访网页时,根据网址中的参数调用数据库数据,即时产生页面内容。由动态页面所对应的原始状态网址也就是动态网址,常包含? = & 等符号,看起来会像这样:

www.example.com/product.php?order=desc&sid=5201314

什么是静态网址?

静态网址,指的就是固定、不会变化的网址,通常不包含网址参数。看起来可能会像这样:

http://www.example.com/example.html

在服务器上实际有一个静态HTML文档存在时对应的网址就会是后面带有.htm .html的静态网址。

由于每个页面都是一个独立的文档,这种静态页面在大量制作和维护上会比较费时费力。

不过后面带有.htm .html的静态网址并不一定都是与静态页面对应的,动态页面可以透过服务器端的技术改写网址,将动态网址改写为静态网址,也可以带有.htm .html等后缀,这就是所谓的「伪静态网址」或是「静态化网址」

两种网址在SEO上有什么差异?

与动态网址比起来,静态网址相对较有叙述性,通常较为简短,也较易于链接的分享。

对于这样的观点,可以参考一下Google在2008年时发布的。

文章内提到的重点如下:

(1)Google有能力能够抓取动态网址,并且没有参数数量上的限制

(2)Google会判断网址中的哪些参数是可以去掉的,动态网址中的参数提供了提示性的消息,让其能够读懂网址。你可以试着去掉不重要的参数,但对于提供额外消息的参数要谨慎。

(3)将网址静态化很很有可能犯错,保留动态参数可以帮助Google理解调换参数顺序后的网址是同一个页面,例如

ww.example.com/article/bin/answer.foo?language=en&answer=3

www.example.com/article/bin/answer.foo?answer=3&language=en

但静态化后,Google不太容易判断两个网址是不是同一个页面,可能引起重复内容,相比于直接提供动态网址,可能引起更多抓取的问题。

并且,若把sid或query参数放进静态化的网址,将产生大量网址不同但页面内容相同的页面。

从上面可以看出Google所持的态度,基本上就是怕网站主因为想要将动态网址改写为静态网址,考虑的却不够周全,或是观念错误、后续维护产生麻烦,所以干脆建议不要修改动态网址,让Google自行解读。

所以在考虑上述Google哦法后,可以在动态与静态网址的取舍做以下考虑:

  • 考虑所要经营的搜索引擎,是否也都如Google一样对于动态网址的检索与收录没有问题。
  • 参数的使用,虽然不会因为数量多寡而影响检索,但应该以让网址尽可能的简短为大原则,最小化参数的数量。
  • 在改写网址时,可以保留具备额外信息的参数。若要静态化,应考虑静态化的方式是否会造成搜索引擎解读信息的困难。
  • 动态网址的结构若是十分复杂,静态化的考虑中容易出现纰漏,可能带来的问题是否非常过静态化带来的好处。
  • 不要将sid或query等参数放入静态化的网址,以免产生大量重复内容的相同页面。

SEO的网址最佳化作法

(1)保持简短的网址

这主要是基于对用户体验的考察,对搜索引擎来说,长长一串网址并不会造成什么问题。

简短的网址比较容易记忆,也易于复制与传播,长网址相对比较容易复制得不完整,造成404错误。

(2)具备描述性

当网址的叙述性文本帮助人们理解的同时,提供给搜索引擎关于页面的信息也会较多,这点对英文网站来说尤其重要。

让用户看到网址就能够大致知道该网址的内容是关于什么,同时,与网页标题和内容互相呼应,有助于用户体验的提升。

(3)在网址中包含关键字

在网址中放置关键字,对于页面的相关性得提高还是有些微帮助。

结合上一点来看,在链接于社区媒体、邮件、网站间传播时,内含的文本或关键字可以让点击链接者对所要前往的网页有间一步的认知。

除此之外,在插入链接时,时常发生没有另外设置锚点文本的情况,这时,网址本身就是非常链接的文本,其中的关键字同样可以帮助了解网页。

最后就是在搜索结果中,一定会列出网址,这也会是用户考虑是否点击链接的因素之一。这些都值得你好好考虑要在网址中放置什么关键字以增进使用体验。

(4)相同内容不同网址的规范化

当你的网站内有两个以上网址内的内容大部分相同时,应考虑利用301重新导向或是rel="canonical"标记,进行网址的规范化。

重复内容并不算是个会被搜索引擎惩罚的项目,但可能造成一些排名指针信号的分散,进而降低网页的排名能力。

关于重复内容的更多介绍,可以参考重复内容(Duplicate Content)如何影响SEO?

(5)如果可以,将网址静态化

关于是否将动态网址静态化的考察,我们在上一个段落详细的讨论过了,建议依网站情况与能力进行考虑。

(6)降低重导向的次数

当从一个网址导向到另一个网址,就可能因此降低网页的速度,在网络速度不快的情况下,可能带来不佳的用户体验。

关于网页速度的更多讨论,可以参考网页速度(page speed)。

(7)考虑减少目录层数

目录层次与全部网站分类的结构相关,分类的层数多,目录层次也会随之增多。

并不是说这些分层会影响网站表现,但网址的分层结构对用户和搜索引擎来说,可作为一种理解网站结构深度的提示。

在可能的情况下,尤其是静态化网址时,可试着精简目录层次,一方面也是简化分类结构。

但这并不是建议将所有页面都放在根目录之下,页数多的网页可能因为这种做法而难以管理,对于页面的从属关系也难以判断。

这点并无一定的作法,需视网站情况斟酌,运用你的专业判断。

(8)字母使用小写

在Microsoft/IIS服务器上,网址包含大小写不会造成什么问题,但如果是使用Linux/UNIX等区分大小写的服务器,则可能因为大小写混用而发生错误。再加上,robots.txt文档也是区分大小写,全部使用小写可以减低错误的发生,对人工输入也较容易,不太容易因大小写参杂而出错

(9)避免在网址中使用空格、逗号和其他特殊符号

网址中的空格或逗号等符号,虽然对Google来说处理起来不见得会有问题,但像是空格会被显示为%20,这些符号的使用会让网址看起来比较难以理解,对网址的传播可能带来负面的影响。

(10)优先使用连字号作为字词间的分隔

关于在网址中分隔字词时该使用连字号「-」还是底线「_」,在SEO的圈子内一直有许多讨论,近一两年也都还有许多相关文章出现。

我们来看看现在台面上有哪些来自Google的信息。

以下影片是Matt Scutts在2011年时,对于网址内该使用连字号还是底线哦明:

影片内提到了一些重要的内容:

使用连字号分隔的字词,会被拆开视为独立的词,与用空格间隔的效果类似,例如red-widget,会被拆分为「red」与「widget」两个词。

而使用底线连接的字词,则是会被视为一全部词汇,如war_of_1812,会被视为「war_of_1812」。

会这么做的原因在于,在Google发展初期,开发的程序工程师希望能够较为精准,让TMP_MAX这类的程序用语在搜索时不被拆分为单独的字词,因而这样设计。

对于其他一般搜索用字,这并不是一个会造成主要影响的因素,以维基百科为例,它在网址中都使用底线分隔字词,但由于其网页内容、网域的权威性等等多种因素的表现,使其网站依旧在极其多的搜索结果中名列前茅。

Matt Cutts建议,若是你要创建新的网站,你可以使用连字号作为字词的间隔。

在2011前的几年间,Google曾考虑是否将底线也用作分隔字词,但由于其对排名的影响比起其他因素来说相对微小许多,所以到当时为止都还没有进行相关的更动。

所以你如果已经有一个网站的网址是使用底线分隔字词,你可以不用大费周章的去将其改为连字号。

在Google Webmasters于2016年的这次直播中,John Mueller提到了:

We don't really care about underscore versus dashes. So that's something where I wouldn't bother setting up redirect for something like that. If the site is set up on one way, and using the other way would be nicer, obviously you could do that. But I don't think you'd see a significant kind of positive effect in search from that alone.

他认为,使用连字号或是底线并不是那么的重要,你可能不会因为使用这两种不同的方式而看出在搜索结果上的明显差别。

提问者接着问道:将以底线分隔的网址重导向至以连字号分隔的网址,会不会对排名带来不好的影响?

John Mueller的回答是:

I mean, the thing to keep in mind there is, essentially, you're doing a site structure change if the URLs on your site. So we don't recognize that you're just, like, flipping out characters there. We see these are completely different URLs. And if you change your internal linking structure and the URLs that you're using on your website, then we kind of have to re-crawl and re-index a whole website to understand it again the context of the individual page. It's kind of the same if you go from, I don't know, from dot PHP to dot HTML or you remove the dot PHP completely. We run across completely new URLs. And we don't understand kind of intuitively this relationship between the old version and the new version. We just see these are new URLs. There are redirects there. The internal linking structure changed significantly. We have to kind of reevaluate the site. And that could result in, after some time, definitely seeing some fluctuations for where things kind of need to settle down. And in the long run, I think you'll see everything come back to the same place again. But it can definitely take, I don't know, a couple of weeks, maybe, to kind of settle down again.

简而言之,就是这么做的确可能会对排名造成影响,因为这样等于是产生了新的网址,并改变了网站既有的架构,搜索引擎需要重新检索与索引以更新其对网站结构的理解,而这会在一段时间内对网站的排名造成波动,但长期来看,或许在几个礼拜过后,网站排名会重回正轨。

最后,来看看这部John Mueller在2018的影片

如果你真的非常想要在这点上彻底做到最好,可以考虑将使用底线的网址重导向至使用连字号的网址,但这么做可能会让你经历一段期间的排名震荡。

cover image credit:

本文网址: https://www.mamioo.com/seo-tuiguang/2nar8943a73w

本站内容均为「码迷SEO」原创整理,未经授权严禁采集转载,违者必究。