百度XML地圖規(guī)范的格式是怎樣的

百度Sitemap支持哪些格式

百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:

txt文本格式

在一個(gè)txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺(tái)進(jìn)行提交

  • http://www.example.com/repaste/101562698_5230191316.html
  • http://www.example.com/repaste/101586283_5230215075.html
  • http://www.example.com/repaste/101639435_5230310576.html

此文本文件需要遵循以下指南:

  1. 文本文件每行都必須有一個(gè)網(wǎng)址。網(wǎng)址中不能有換行。
  2. 不應(yīng)包含網(wǎng)址列表以外的任何信息。
  3. 您必須書寫完整的網(wǎng)址,包括 http。
  4. 每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個(gè),則可將列表分割成多個(gè)文本文件,然后分別添加每個(gè)文件。
  5. 文本文件需使用 UTF-8 編碼或GBK編碼。

xml格式

單個(gè)xml數(shù)據(jù)格式如下:

  1. <?xml version=\”1.0\” encoding=\”utf-8\”?>
  2. <!– XML文件需以utf-8編碼–>
  3. <urlset>
  4. <!–必填標(biāo)簽–>
  5.     <url>
  6.         <!–必填標(biāo)簽,這是具體某一個(gè)鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 –>
  7. ????????<loc>http://http://www.zzgyrme.cn/sitemap.html</loc>
  8.         <!–必填,URL鏈接地址,長度不得超過256字節(jié)–>
  9.         <lastmod>2009–12–14</lastmod>
  10.         <!–可以不提交該標(biāo)簽,用來指定該鏈接的最后更新時(shí)間–>
  11.         <changefreq>daily</changefreq>
  12.         <!–可以不提交該標(biāo)簽,用這個(gè)標(biāo)簽告訴此鏈接可能會(huì)出現(xiàn)的更新頻率 –>
  13.         <priority>0.8</priority>
  14.         <!–可以不提交該標(biāo)簽,用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0–1.0之間–>
  15.     </url>
  16.     <url>
  17. ????????<loc>http://http://www.zzgyrme.cnm/blog/476/</loc>
  18.         <lastmod>2010–05–01</lastmod>
  19.         <changefreq>daily</changefreq>
  20.         <priority>0.8</priority>
  21.     </url>
  22. </urlset>?

上述Sitemap向百度提交了一個(gè)url:http://www.zzgyrme.cn/sitemap.html

若有多條url,按照上述格式重復(fù)之間的片斷,列明所有url地址,打包到一個(gè)xml文件,向站長平臺(tái)進(jìn)行提交。

Sitemap索引格式

如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然后將該索引文件提交。您無需分別提交每個(gè)文件。

  1. <?xml version=\”1.0\” encoding=\”utf-8\”?>
  2. <!– XML文件需以utf-8編碼–>
  3. <sitemapindex>
  4. <!–必填,以 <sitemapindex> 開始標(biāo)記作為開始,以 </sitemapindex> 結(jié)束標(biāo)記作為結(jié)束–>
  5.     <sitemap>
  6.         <!–必填,以<sitemap>標(biāo)簽提交一個(gè)子sitemap文件–>
  7.                     <loc>http://example.com/ext/xmlsitemap/add/201201/index_20120106.xml</loc>
  8.         <!–必填,識(shí)別sitemap的位置–>
  9.         <lastmod>2009–12–14</lastmod>
  10.         <!–選填,識(shí)別相對sitemap文件的修改時(shí)間–>
  11.     </sitemap>
  12.     <!–必填,標(biāo)簽閉合–>
  13. </sitemapindex>
  14. <!–必填,標(biāo)簽閉合–>?

有多個(gè)Sitemap,按上述格式重復(fù)之間的片斷,列明所有Sitemap地址,向站長平臺(tái)進(jìn)行提交。

創(chuàng)建Sitemap時(shí)有哪些注意事項(xiàng)?

第一,一個(gè)Sitemap文件包含的網(wǎng)址不得超過 5 萬個(gè),且文件大小不得超過 10 MB。如果您的Sitemap超過了這些限值,請將其拆分為幾個(gè)小的Sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因提供大文件而超載。

第二,一個(gè)站點(diǎn)支持提交的sitemap文件個(gè)數(shù)必須小于5萬個(gè),多于5萬個(gè)后會(huì)不再處理,并顯示“鏈接數(shù)超”的提示。

第三,如果驗(yàn)證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。

如何提交Sitemap

第一步,將需提交的網(wǎng)頁列表制作成一個(gè)Sitemap文件,文件格式請閱讀百度Sitemap協(xié)議都支持哪些格式。

第二步,將Sitemap文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為example.com,您已制作了一個(gè)sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml

第三步,登錄百度站長平臺(tái),確保提交Sitemap數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。

第四步,進(jìn)入Sitemap工具,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址

最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點(diǎn)擊更新所選,即對更新的網(wǎng)站鏈接進(jìn)行了提交。

什么是移動(dòng)Sitemap協(xié)議,如何提交移動(dòng)Sitemap協(xié)議

百度推出了移動(dòng)Sitemap協(xié)議,用于將網(wǎng)址提交給移動(dòng)搜索收錄。百度移動(dòng)Sitemap協(xié)議是在標(biāo)準(zhǔn)Sitemap協(xié)議基礎(chǔ)上制定的,增加了標(biāo)簽,它有四種取值:

  1. <mobile:mobile/> :移動(dòng)網(wǎng)頁
  2. <mobile:mobile type=\”mobile\”/> :移動(dòng)網(wǎng)頁
  3. <mobile:mobile type=\”pc,mobile\”/>:自適應(yīng)網(wǎng)頁
  4. <mobile:mobile type=\”htmladapt\”/>:代碼適配?

無該上述標(biāo)簽表示為PC網(wǎng)頁

下方樣例相當(dāng)于向百度移動(dòng)搜索提交了一個(gè)移動(dòng)網(wǎng)頁:http://m.example.com/index.html,向PC搜索提交了一個(gè)傳統(tǒng)網(wǎng)頁:http://www.example.com/index.html,同時(shí)向移動(dòng)搜索和PC搜索提交了一個(gè)自適配網(wǎng)頁http://www.example.com/autoadapt.html:

  1. <?xml version=\”1.0\” encoding=\”UTF-8\” ?>
  2. <urlset xmlns=\”http://www.sitemaps.org/schemas/sitemap/0.9\”
  3. xmlns:mobile=\”http://www.baidu.com/schemas/sitemap-mobile/1/\”>
  4. <url>
  5. <loc>http://m.example.com/index.html</loc>
  6. <mobile:mobile type=\”mobile\”/>
  7. <lastmod>2009–12–14</lastmod>
  8. <changefreq>daily</changefreq>
  9. <priority>0.8</priority>
  10. </url>
  11. <url>
  12. <loc>http://www.example.com/index.html</loc>
  13. <lastmod>2009–12–14</lastmod>
  14. <changefreq>daily</changefreq>
  15. <priority>0.8</priority>
  16. </url>
  17. <url>
  18. <loc>http://www.example.com/autoadapt.html</loc>
  19. <mobile:mobile type=\”pc,mobile\”/>
  20. <lastmod>2009–12–14</lastmod>
  21. <changefreq>daily</changefreq>
  22. <priority>0.8</priority>
  23. </url>
  24. <url>
  25. <loc>http://www.example.com/htmladapt.html</loc>
  26. <mobile:mobile type=\”htmladapt\”/>
  27. <lastmod>2009–12–14</lastmod>
  28. <changefreq>daily</changefreq>
  29. <priority>0.8</priority>
  30. </url>
  31. </urlset>?

按照移動(dòng)Sitemap協(xié)議做好Sitemap后,在Sitemap工具點(diǎn)擊添加新數(shù)據(jù)提交,與提交普通Sitemap方式一致。

我提交時(shí)填寫的周期是什么含義?

百度Spider會(huì)參考設(shè)置周期抓取Sitemap文件,因此請根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置。請注意若url不變而僅是url對應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。Sitemap工具不能解決頁面更新問題。

Sitemap提交后,多久能被百度處理?

Sitemap數(shù)據(jù)提交后,一般在1小時(shí)內(nèi)百度會(huì)開始處理。在以后的調(diào)度抓取中,如果您的sitemap支持etag,我們會(huì)更頻繁抓取sitemap文件,從而及時(shí)發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會(huì)比較長。

提交的Sitemap都會(huì)被百度抓取并收錄嗎?

百度對已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。

我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?

可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759字節(jié))。

XML格式的 Sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?

不會(huì)。Sitemap 中的“priority”提示只是說明該網(wǎng)址相對于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會(huì)影響網(wǎng)頁在搜索結(jié)果中的排名。

網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用?

不會(huì)。網(wǎng)址在 Sitemap 中的位置并不會(huì)影響百度對它的識(shí)別或使用方式。

Sitemap中提交的url能否包含中文?

因?yàn)檗D(zhuǎn)碼問題建議最好不要包含中文。

URL列表—XML格式及規(guī)范說明:

標(biāo)簽名稱標(biāo)簽說明標(biāo)簽類型標(biāo)簽限制可選/必選舉例
urlset
urlurl標(biāo)記每條信息的開始和結(jié)束//可選
最多出現(xiàn)50000次
url
loc該條數(shù)據(jù)的存放地址任意URL最小長度1個(gè)字符
最大長度256個(gè)字符
符合正則表達(dá)式(http://)(.+)
必選http://www.baidu.com/
lastmod指該條數(shù)據(jù)的最新一次更新時(shí)間日期或日期時(shí)間格式為:YYYY-MM-DD[Thh:mm:ss],
日期與時(shí)間之間使用T分隔,可以僅提供年月日部分
可選2013-01-01
changefreq指該條數(shù)據(jù)的更新頻率字符串有效值為:
always、hourly、daily、weekly、monthly、yearly、never
可選always
priority用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間小數(shù)大于等于0.0
小于等于1.0
可選1.0

XML格式舉例

  1. <?xml version=\”1.0\” encoding=\”UTF-8\”?>
  2. <urlset>
  3. <!– urlset,urlset用來標(biāo)記整個(gè)文檔的開頭,最少出現(xiàn)1次 最多出現(xiàn)1次 –>
  4.     <url>
  5.     <!– url,url標(biāo)記每條信息的開始和結(jié)束,最少出現(xiàn)0次 最多出現(xiàn)50000次 –>
  6.         <loc>http://www.baidu.com/</loc>
  7.         <!– loc,該條數(shù)據(jù)的存放地址,最少出現(xiàn)1次 最多出現(xiàn)1次,類型為URL地址,最小長度1個(gè)字符 最大長度256個(gè)字符 必須符合正則表達(dá)式(http://)(.+) –>
  8.         <lastmod>2013–01–01</lastmod>
  9.         <!– lastmod,指該條數(shù)據(jù)的最新一次更新時(shí)間,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為日期或日期時(shí)間,格式為YYYY-MM-DD的日期或者格式為YYYY-MM-DDThh:mm:ss的日期時(shí)間(請注意日期與時(shí)間之間以“T”分隔) –>
  10.         <changefreq>always</changefreq>
  11.         <!– changefreq,指該條數(shù)據(jù)的更新頻率,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為字符串,有效值為:always、hourly、daily、weekly、monthly、yearly、never –>
  12.         <priority>1.0</priority>
  13.         <!– priority,用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0–1.0之間,最少出現(xiàn)0次 最多出現(xiàn)1次,類型為小數(shù),最小值為(包含)0.0 最大值為(包含)1.0 –>
  14.     </url>
  15. </urlset>
? 版權(quán)聲明
THE END
喜歡就支持一下吧
點(diǎn)贊681 分享
評論 搶沙發(fā)

請登錄后發(fā)表評論

    暫無評論內(nèi)容