Sitemap.xml是google搞出來的,也就是網(wǎng)站地圖,不過這個網(wǎng)站地圖是用xml寫的,而且要按google的標(biāo)準(zhǔn)來寫,并且要將寫出來的這個文件sitemap.xml上傳到自己的服務(wù)器空間中去。目前,Google, Yahoo, MSN都已經(jīng)聲明支持這種格式,Baidu還沒有聲明支持,但估計走這一步也是大勢所趨。這將是向眾多搜索引擎提供你網(wǎng)站信息的一種很好的方法。
提交sitemap一是有利于搜索抓取一些正常抓取過程中無法抓取的網(wǎng)址,比如動態(tài)網(wǎng)頁,包含大量AJAX的網(wǎng)頁或者flash的頁面。二是為搜索蜘蛛指明“工作方向”。Sitemap就是你網(wǎng)站上頁面的列表,googlebot就按照這個去一個個的抓取收錄頁面,顯然比它自己去找會效率高,而且要全。Google網(wǎng)站上有完整的關(guān)于sitemap.xml的詳細(xì)說明:
http:///support/webmasters/bin/answer.py?answer=40318&hl=zh_CN
但很多站長看后仍然不會操作,下面這個教程就是手把手教會你創(chuàng)建Sitemap.xml。
1. Sitemap.XML 的格式
完整格式如下:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http:///schemas/sitemap/0.84" >
<url>
<loc>http:///default.asp</loc>
<lastmod>2008-07-17</lastmod>
<changefreq>daily</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc> http:///search2.asp?id=32003044&sq=1</loc>
<lastmod>2008-07-17</lastmod>
<changefreq>weekly</changefreq>
<priority>0.9</priority>
</url>
…
…
</urlset>
下面,對以上標(biāo)簽分別加以解釋
a) <?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http:///schemas/sitemap/0.84" >
這兩行就相當(dāng)于網(wǎng)頁文件中的<html>標(biāo)簽一樣的作用。不必管這兩行什么意思,照抄即可。
切記:一個字符也不能錯,即使多一個空格,google網(wǎng)站采集時也會報錯。另外,千萬別忘了在文件的末尾加上</urlset>標(biāo)簽。
b) url:每個標(biāo)簽包含一個網(wǎng)頁地址,是以下標(biāo)簽的父標(biāo)簽。
c) http:///default.asp
這里是頁面鏈接地址,也就是你希望蜘蛛訪問的地址。
切記:在地址中出現(xiàn)的某些特殊字符需要使用轉(zhuǎn)義字符,否則,google也會報錯。最典型的就是 & 號,經(jīng)常在動態(tài)網(wǎng)址中出現(xiàn),在提交地址中必須寫成 & 如:提交http:///search2.asp?id=32003044&sq=1,google管理員工具就會報錯,而改為 http:///search2.asp?id=32003044&sq=1提交后就沒有問題了。我看到網(wǎng)上有人說sitemap.xml只能提交一個參數(shù)的網(wǎng)頁的說法,其實(shí)成都網(wǎng)絡(luò)營銷多半是因?yàn)闆]有使用轉(zhuǎn)義字符而導(dǎo)致出錯的。其他的轉(zhuǎn)義字符就不一一列出了,大家可以在網(wǎng)上查。
d) lastmod:頁面{zh1}修改時間
這個很重要。Google的機(jī)器人會在索引此鏈接前先和上次索引記錄的{zh1}更新時間進(jìn)行 比較,如果時間一樣就會跳過不再索引。所以如果你的鏈接內(nèi)容基于上次Google索引時的內(nèi)容有所改變,應(yīng)該更新該時間,讓Google下次索引時會重新 對該鏈接內(nèi)容進(jìn)行分析和提取關(guān)鍵字。這里必須用ISO 8601中指定的時間格式進(jìn)行描述,格式化的時間格式如下:
年:YYYY(2008)
年和月:YYYY-MM(2008-06)
年月日:YYYY-MM-DD(2008-06-04)
年月日小時分鐘:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37+08:00)
年月日小時分鐘秒:YYYY-MM-DDThh:mmTZD(2008-06-04T10:37:30+08:00)
這里需注意的是TZD,TZD指定就是本地時間區(qū)域標(biāo)記,像中國就是+08:00了
切記:其他格式可能引起出錯,比如將2008-08-08 寫成2008-8-8就會出問題。
e) changefreq:頁面內(nèi)容更新頻率。
這里可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就不用解釋了吧,光看單詞的意思就明白了。
f) priority:相對于其他頁面的優(yōu)先權(quán)
定于0.0 - 1.0之間 。
切記:建議將各類網(wǎng)頁根據(jù)重要性給出不同的數(shù)值,以方便蜘蛛的采集,不要耍小聰明全部寫1.0,google管理工具會報錯的。
2. Sitemap.xml制作方式
制作方式無非兩種,自動方式和手動方式。
自動方式一般使用生成工具自動生成,只需輸入自己的網(wǎng)址,就可以得到完整的xml文件。這種方式一般適用于靜態(tài)網(wǎng)站,在此不再贅述。但需要提醒的是,網(wǎng)上的工具良莠不齊,生成的文件經(jīng)常有錯誤,不一定能通過google的校驗(yàn),使用者需認(rèn)真辨別。
手工方式則是由站長手工填寫或?qū)懗绦蛲瓿删?,代碼很簡單,大家可以到網(wǎng)上查找。
3. 提交
Sitemap.xml制作完成后,就需要將xml文件提交到相關(guān)搜索引擎。
Google提交網(wǎng)址:http:///webmasters/sitemaps/?hl=zh-CN
Yahoo提交網(wǎng)址:http://./
提交后,一般在幾個小時之內(nèi),系統(tǒng)就開始下載處理了。
4. Sitemap.xml的校驗(yàn)
至于你的網(wǎng)站地圖是否符合標(biāo)準(zhǔn),最方便的手段就是使用google的管理員工具了。
在他下載你的sitemap.xml后幾天內(nèi),這個工具就會將詳細(xì)的分析結(jié)果反饋回來,包括:sitemap.xml中包含了多少地址,google已將多少地址加入索引,sitemap.xml中出現(xiàn)了哪些錯誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網(wǎng)頁有404,500錯誤都會詳細(xì)的羅列出來,非常方便。
如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤快,頁面被收錄當(dāng)然也就更快。
1、除非你確認(rèn)自己掌握了,否則不要去試WIN2003的防火墻
WIN2003防火墻打開后,默認(rèn)是禁止3389端口的,很多站長在啟用了防火墻后一重啟服務(wù)器就再連不上3389了。所以除非你確認(rèn)自己知道這個防火墻的使用,否則就不要去碰它。
還有的朋友是改了端口卻忘記了在防火墻里開放新的端口。有的朋友則人根本不會改端口,直接在服務(wù)器上試的,結(jié)果沒改成功,重啟就進(jìn)不去了。
遇到這種情況,必須告訴機(jī)房維護(hù)人員您的服務(wù)器密碼,讓他們幫你停止防火墻。
2、千萬小心,不要禁用了網(wǎng)卡
很多人在自己的電腦上就喜歡劈劈pp點(diǎn)鼠標(biāo),在服務(wù)器上可要小心,本地連接上右鍵一下,然后左鍵一下,很可能就點(diǎn)了禁用了。結(jié)果可想而知。
遇到這種情況和上面一樣,要告訴維護(hù)人員你的服務(wù)器密碼才行。
3、別忘記了更改超管密碼
一般IDC給用戶的服務(wù)器裝完了系統(tǒng)都有個默認(rèn)的密碼的,不修改的話很容易被黑。
4、請注意當(dāng)你要求機(jī)房維護(hù)人員為你重啟服務(wù)器時,那將是一次非正常關(guān)機(jī)。
如果你確認(rèn)你的服務(wù)器還沒有wq死機(jī),并且不希望非正常關(guān)機(jī),那么可以由機(jī)房維護(hù)人員插上顯示器鍵盤等幫你從系統(tǒng)里重啟,但是前提還是你要告訴維護(hù)人員服務(wù)器密碼。
5、不要在服務(wù)器上瀏覽網(wǎng)頁或者運(yùn)行沒有用過的程序
或者說不要給服務(wù)器太多不安全的因素。如果沒有安裝補(bǔ)丁或者殺毒軟件,在服務(wù)器上瀏覽網(wǎng)頁將可能使服務(wù)器感染木馬或者病毒。在服務(wù)器上運(yùn)行沒有用過的程序也有同樣的危險,或者有可能導(dǎo)致服務(wù)器上的默認(rèn)設(shè)置被改變。
6、盡量不要一邊看教程一邊在服務(wù)器上設(shè)置
就算教程是{zx1}的最完整的,我們{dy}次操作的時候仍然可能出現(xiàn)問題,而因?yàn)槭莧dy}次,很難記清自己操作的全部過程,{zh1}可能導(dǎo)致連有經(jīng)驗(yàn)的人過來也無法wq設(shè)置好你的服務(wù)器了。
{zh0}先在自己的電腦上演練一遍,確認(rèn)沒有問題了再在服務(wù)器上測試。
7、有了服務(wù)器,就要學(xué)著去使用它。
使用服務(wù)器,這看似很簡單的事情,其實(shí)是一門很大的學(xué)問,沒有哪個高手可以說他可以解決服務(wù)器里的所有的問題,更沒有誰敢說他的服務(wù)器不會被黑。
所以不要總是抱怨別人不能幫你解決問題,如果你在租用或者購買服務(wù)器之前對服務(wù)器內(nèi)部的設(shè)置一無所知,那么千萬不要把維護(hù)服務(wù)器的希望寄托在臨時找人幫忙上,要么就找個能長期幫自己的人,要么就干脆聘技術(shù)員,{zh0}還是自己盡快學(xué)起來,因?yàn)闆]有誰會比你自己更了解你的服務(wù)器了。
8、一定不要忘記了做備份
雖然大多數(shù)時候備份是用不上的,但是一旦用上的時候沒有備份那就是天大的災(zāi)難。在使用服務(wù)器的初期,誤操作導(dǎo)致數(shù)據(jù)丟失的可能性很大,病毒和黑客入侵也會使你的網(wǎng)站數(shù)據(jù)毀于一旦,并且不要忘記了服務(wù)器最容易損壞的硬件就是硬盤。