因為架設自己的 blog而後接觸到一些有關於網站 seo的相關問題,本站不會是一個專門探討有關 seo的網路,畢竟網路上已經有很多的相關專業網站和許多有關 seo的文件可供大家參考,我的目標往後會是開幾個網站,而這個 blog是一個屬於自己的天地,也可以順便做一些試驗,往後可能會碰到更多有關 SEO的問題,這裡就會記錄我所有有實現的 seo步驟,和我翻譯一些英文的文章,至於我沒有實現的部分就不會在這裡寫,大家自己去網路上參考就可以了!!
本篇文章來自於 搜索引擎优化SEO每天一贴 這個我覺得有很多不錯的文章的網站,原本是簡體中文的內容,我大概是拼湊一些我覺得我可以用到的部分做個拼貼的內容而已,看這篇文章前你可先參考原作者的這篇文章 URL的优化,再看 URL网址规范化,原文章講的已經夠完整的,我也只是拼貼文章囉,建議大家可以多看看相關的文章 !!
網址的 URL規範化(URL canonicalization)指的是 Google搜索引擎在挑選最好的一個 URL網址當作你真正網址的一個過程。大致上總結文章內容,其實我們網站通常要做 URL規範化的第一件事,就是統一底下的這幾個網址,將其導向同一個地方
以我們網站而言,下面這幾個 URL一般來說指的都是同一個文件或是網頁才對:
1. http://www.cocolike.com (含 www的網域名稱)
2. http://cocolike.com (不含 www的網域名稱)
3. http://www.cocolike.com/index.html (含 www的網域名稱的首頁 index.html)
4. http://cocolike.com/index.html (不含 www的網域名稱的首頁 index.html)
但是從技術上來說(也對搜尋引擎來說),這幾個 URL網址所代表的都是不同的網頁內容(也確實可以是不同的網頁)。當然無庸置疑的,在絕大部分的情況下,這些網址所返回來的都是相同的文件內容,也就是你網站的主頁。但是從技術上來說,對這幾個網址 URL而言,確實是可以從主機返回不同的內容,因此這些搜尋引擎也必須將其視為不同的網頁。
當搜索引擎要規範化其網址的時候,搜索引擎必須要從這些網址選擇當中一個最好的代表。因此一般來說,你的首頁應該是固定的只有一個。但是常常在很多網站上站長在鏈接回主頁時,所使用的URL並不是唯一的。意思是很可能在你的網站上,一會兒連到 URL http://www.cocolike.com,一會兒連到 URL http://www.cocolike.com/index.html 。
雖然這不會給我的訪客造成什麼麻煩,因為這些網址都是同一個文件,但是對 Google來說卻是造成了困惑,哪一個網址是你真正的主頁呢? 如果在你的網站上,不同版本的網址都大量出現,那麼這兩個 URL可能都會被 Google收錄進資料庫,這時候就會造成所謂的複制內容網頁了。
補充: 其實我對這個www的問題,不算太有感覺,因為我的 blog網站在一開始的時候是沒有做任何的 seo的,直到後來才慢慢的加上許多自己可以做到的主動性的 seo動作,但是我發現在 Google的索引中,重複性內容其實在這方面並不算嚴重,甚至可以說還相當輕微,也許我的blog是個非常小的站吧?? 不過自己可以控制的一些 seo動做還是做一做比較好 !!
所謂的複製內容網頁,指的是兩個或多個網頁的內容是相同或大部分相似的。搜索引擎通常也只會挑出其中一個來做返回搜索的結果,而把其他的複製網頁都排在最後面(或是標示為複製內容),以至於根本找不到。
當你的網站出現網址 URL規範化問題的時候,會影響到搜索引擎結果排名。
從站長的角度來考慮,你應該要做兩件事:
1)你的網站內部在連結到其他網頁時,尤其是主頁時,記得只使用一種 URL。不管是包含 www或是不包含 www,你要自始至終的只使用一個版本。這樣搜索引擎也比較會明白哪一個才是你規範化的主要網址。
2)你沒辦法控制別的網站用哪一個網址連向你的主頁。所以你應該在你的主機的伺服器上,把所有有可能成為主頁網址的URL,做 301重新導向(301 Redirect)到你所選擇的主頁網址版本。
另外比較重要的一點是,如果你的網站出現 URL規範化的問題,千萬不能使用 Google的網址刪除需求,來要求去刪除其中的一個網址版本。比如說,你所要的是帶有www的版本 http://www.cocolike.com,但是你千萬不能到 Google的網站上填表,要求把沒有 www的主頁網址給刪除掉。因為那樣做的話,你整個的域名有可能被刪除6個月。
所以你所要做的事情是,把上述的那4個 URL都統一導向到其中唯一的一個網址去,那會選擇哪一個網址呢?? 建議使用的是沒有 www的那一個網址,首頁的 index是比較輕微的問題,別忘了 www也算是所謂的子網域,對於 Google而言,有含 www和不和 www的兩個網址是完全兩個不同的網域,底下所有的目錄和網頁都會被當做完全不同的兩個網站來看待,那你要做搜尋引擎最佳化(seo)也必須花2次功夫嘛??
結論是,把 htp://www.cocolike.com 用 301導向到 http://cocolike.com,或者把 http://cocolike.com 用301導向到 http://www.cocolike.com,是一定必須做的事情,然後另一個也不要去刪除,就讓 Google自己去處理
我的 wordpress在這方面有外掛可以做解決,當然在 wordpress 2.3版本以上也已經內建解決這個問題了,而在你自己建立的網站時,你可以利用 . htaccess來解決這個問題 !!
引用來源
作者: Zac@SEO每天一贴
原載: 中新虚拟主机 版權所有。
