sitemap.xml网站地图是什么?从工具/产生器/程序制作到进行提交教学

作者:码迷
作者:码迷SEO
发布时间:2019-11-20 13:00:01阅读:18点赞:5

sitemap.xml网站地图是什么?从工具/产生器/程序制作到进行提交教学/

对许多一开始就接触seo的人来说,最常遇到的问题就是sitemap.xml到底是什么碗糕。这不论是在哪一个seo参考书或是新手教学都是一定会出现的项目。这两个项目对营销人员而言,看到代码就会害怕;而对程序开发者却也是不一定有接触过的项目,对于如何实作也是一知半解。

因此,这一篇文章将以深入浅出的方式介绍sitemap.xml到底是什么东西,而又该如何实作。不论是从新手利用产生器产生Sitemap,到若是有工程师协助时该如何制作自己的完整Sitemap,你都能够在这一篇看到。

到底,sitemap.xml是什么东西!?

在认识Sitemap之前,先大略介绍一下xml文档是什么。

可延伸标记式语言(英语:Extensible Markup Language,简称:XML),是一种标记式语言。标记指电脑所能理解的信息符号,通过此种标记,电脑之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记式语言,比如HTML,也可以使用像XML这样由相关人士自由决定的标记式语言,这就是语言的可延伸性。XML是从标准通用标记式语言(SGML)中简化修改出来的。它主要用到的有可延伸标记式语言、可延伸样式语言(XSL)、XBRL和XPath等。(以上节录自 )

一个sitemap.xml文档,最基本的样子可能是长这样的:

而我们说需要做的,就是将网站内所有的网址都填进去,假设我的网站有首页、a.html、b.html,我的Sitemap就会长这样:

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://www.example.com.tw</loc> </url> <url> <loc>https://www.example.com.tw/a.html</loc> </url> <url> <loc>https://www.example.com.tw/b.html</loc> </url> </urlset>

<? xml version = "1.0" encoding = "UTF-8" ?> <urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" >    <url>      <loc> https://www.example.com.tw </loc>    </url>    <url>      <loc> https://www.example.com.tw/a.html </loc>    </url>    <url>      <loc> https://www.example.com.tw/b.html </loc>    </url> </urlset>

不要怀疑,就是这么简单就可以完成你的Sitemap文档了。完成之后将文档上传到网站的根目录,并输入网址「 http://www.example.com/sitemap.xml」 ,就可以看到你的Sitemap已经上传成功。

网页上的sitemap

sitemap.xml文档的提交

Sitemap文档已经完成了之后, 接着要完成的任务就是要在Google Search Console(以下简称SC)及Bing Webmaster内完成提交。

提交sitemap

真的是简单到笔者第一次完成时还在怀疑这样真的可以吗!?如果真的不放心,过几天后,等待Google读取完成你的Sitemap,再到Search Console内就可以看到提交的Sitemap内的网址的收录情形。

Search Console Sitemap收录状况

以这个网站为例,虽然提交了80个网页,确实被收录的页面却只有36个。从这里就可以知道,在提交的80个网页中有44个网页是没有被收录的。不过在这个报告内,并没有办法可以确切知道哪些是没有被收录到的网页,但是依然是查看网站收录状况的好帮手。

使用Sitemap制作工具来快速制作Sitemap

使用手刻的方式制作sitemap.xml文档可能在网站规模小时还可以一个一个网址写上去,但当网站成长到一定规模时就一定会需要使用一些其他方法来辅助制作sitemap.xml文档了,以下将会简单介绍一些好用的工具。

1. XML-Sitemaps在线Sitemap制作工具

sitemap在线产生器

网址:

此工具提供免费在线制作Sitemap,以500个网址为限。此工具对于小网站而言已经相当足够,可以迅速完成Sitemap。

2. wonderwebware.com的Sitemap Generator线下工具

sitemap线下产生器

网址:

此工具为线下版工具,需要下载后才能使用。优点为免费且没有网址数量限制。它亦有可以看到所有网址Title的功能,相当实用。

大型网站的Sitemap要如何制作

在大型网站要制作sitemap时所要考察的因素与小型网站大大的不同。这时候往往会遇到以下这些问题:

1. 网址数量往往非常过一个Sitemap文档可以乘载的大小

根据Google的Sitemap官方指南,每个Sitemap文档内网址的极限数量只能有50,000 个。因此当网站规模大于这个大小时,可以考虑在制作Sitemap时用创建目录档(sitemap_index)的方式,如此一来可以对各个Sitemap文档进行管理。

2. 单靠Sitemap制作工具依然会有许多网页没办法被找到

这是因为Sitemap的制作工具其理解网站的方式一样是依靠Crawler在网站中找出所有的网页。因此可以理解成用Sitemap制作工具找到的网页基本上都是google本身就有办法找到的,但是Sitemap最大的功能就是让搜索引擎能够在网站中发现它无法找到的网页,因此若只单单使用这些工具对网站结构越复杂、越大型的网站是绝对不够的。

3. 每天都有大量新页面产生,需要时时更新Sitemap内的内容

一般来说使用Sitemap工具并没有办法时时刻刻更新Sitemap的内容,而每一次更新时都会需要机器人在自己的网站上重新爬取一次所有的链接,相当没有效率,尤其不可能只要有新的内容就重新操作一次这样的动作。

使用程序来自行产生Sitemap吧!

基于上述所提到的问题,如果Sitemap能够由代码自动产生,那么自然可以用一次的开发成本来省去许多管理的时间。因此以下将提供几个自行制作sitemap.xml文档的方法:

1. WordPress插件

Yoast添加Sitemap

如果你的网站刚好是使用wordpress所架设,那么只需要使用插件就能够自动产生Sitemap文档了。像是平常许多wordpress网站都有使用的seo插件Yoast,就有这样的功能,可以帮助你直接将wordpress内出现的所有网页一次整理在Sitemap文档内,而且他们也有使用Sitemap index喔!

2. 透过Github上的编程语言/框架的相关模块/套件来制作

在Github上,已有许多前人有撰写过相关的代码。若己身所使用的框架已经有他人撰写过相关的程序,不仿就直接使用吧!

yii Sitemap

laravel sitemap产生程序

建议可以在自己开始开发前,先在网络上寻找是否有前人已经撰写过的代码!

3. 自行开发Sitemap产生机制

对于自行开发的网站而言当然没有办法用以上的方式来制作Sitemap,因此自行开发在所难免。自行开发可以对于使用他人代码所产生的资案疑虑可以大大降低,更能够串连数据库及时添加产生的新网址,其弹性可以大大增加。像是为网址加上<lastmod>、<priority>等属性,或是将较重要的网址放在Sitemap前方、甚至制作图片Sitemap、影片Sitemap等,这些都是在自行开发时可以设计的机制。(这些高端的项目在此文章先不多谈,如果有兴趣请让我们知道,我们再来深入讨论!)

结语

目前搜索引擎爬取网站的技术比其实年前已经进步得太多,因此透过Sitemap.xml辅助来爬取网站的需求已经越来越少。但是透过正确的Sitemap制作依然可以有效的查看自己网站确切的网址数量有多少,从而与Google的收录数进行比较,以确认目前的网站的收录状况。赶快从上述方式中挑选最适合自己的,为自己的网站制作Sitemap文档吧!

本文网址:https://www.mamioo.com/seo-beginner/r15e75v58an4

本站内容均为「码迷SEO」原创整理,未经授权严禁采集转载,违者必究。
评论
相关文章
  • SEO搜索引擎优化如何与社区营销相辅相成?

    SEO搜索引擎优化如何与社区营销相辅相成?

    由于社区的传播力量强大,吸引了许多网络营销企划人与企业主努力经营。 但这些Social Media平台,如Facebook、instagram对于SEO搜索引擎最佳化而言,又有哪些好处? SEO和社区营销又该如何相辅相成?社区会不会影响网站排名?awoo透过这篇告诉你。继续阅读>>

    37浏览4赞2019-10-30 14:03:53
  • SEO基本功!面包屑(Breadcrumbs)让搜索引擎爱上你

    SEO基本功!面包屑(Breadcrumbs)让搜索引擎爱上你

    面包屑导览页(Breadcrumbs)是创建网站时不可或缺的功能,在浏览网页和SEO搜索引擎的检索上都非常重要,不过什么是面包屑?看似不起眼的面包屑又该如何提升网页对搜索引擎友好度?awoo带你简单了解面包屑对SEO的重要性和优化重点!继续阅读>>

    57浏览15赞2019-10-31 10:53:06
  • 商家需要在地化搜索、 Google 我的商家的 4 个理由

    商家需要在地化搜索、 Google 我的商家的 4 个理由

    Local Search(在地化搜索),是个在中国目前尚未成为主流的营销领域,不过在国际市场上,竞争在地化搜索已经是行之有年了,随着地理定位服务的普及与营销目标越来越精准的背景下,Google、Moz...许多国外的营销公司,都已经将在地化搜索纳入的服务的项目。继续阅读>>

    4浏览0赞2019-12-05 13:00:01
  • Google Search Console 教学,5种非常完整安装方法!

    Google Search Console 教学,5种非常完整安装方法!

    什么是Google Search Console? 对很多网站的经营者来说,Search Console是不可缺少的秘密武器,它能够协助网站经营者监控以及维持网站在Google搜索结果中的排名,可以说是网站与Google的交互纪录平台。对SEO操作而言,善用这项工具管理网站,除了可以了解网页被搜索和点击次数、页面是否适合行动版设备浏览,也会提示哪些网页需要如何调整能让Google搜索引擎收录进去(毕竟被Google收录后,读者才有机会利用关键字搜索搜到关于自家网站的信息呀!),那在开始分析前,需要先安装Search Console并做验证,至于该如何进行验证呢? Search Console安装教学,从5种方法中选出最适合你的。 若尚未验证拥有该网域权限,Google Search Console会提示您有多种方式可以验证,其目的是为了让Google Search Console知道你是这网站的拥有者,目前能进行验证网域的方式有: awoo将提供最完整安装方法与步骤教学,大家可以依目前拥有工具为考察,如果决定好方式我们就直接进入主题,依照以下的教学步骤来进行安装Search Cons继续阅读>>

    20浏览5赞2019-11-20 13:40:01
  • 图片搜索也能SEO,4种技巧大公开

    图片搜索也能SEO,4种技巧大公开

    随者Google搜索功能越来越强大,现在连图片也能搜索。既然有搜索,也就会有图片搜索SEO。Google搜索团队的Gary在冲绳会议中与大家分享图片搜索SEO技巧,现在由阿物来向大家分享。继续阅读>>

    16浏览3赞2019-11-22 09:00:01
  • 写给程序麻瓜的JavaScript基础介绍,跟工程师沟通零障碍

    写给程序麻瓜的JavaScript基础介绍,跟工程师沟通零障碍

    什么是Javascript?想知道Javascript通常用什么地方?运作的原理是什么?awoo用深入浅出的方式告诉你什么是Javascript,让你更了解Javascript。继续阅读>>

    7浏览1赞2019-12-02 11:00:02