- 盡量使用靜態(tài)網(wǎng)頁:目前能夠像Google一樣對動態(tài)網(wǎng)頁進行索引的搜索引擎還比較少,而即使是Google也更不會索引所有的內(nèi)容,總體上說Google喜歡新的,靜態(tài)的內(nèi)容。
因此無論從效率上講還是方便搜索引擎收錄,使用內(nèi)容發(fā)布系統(tǒng)將網(wǎng)站內(nèi)容發(fā)布成靜態(tài)網(wǎng)頁都是非常必要的。 比如:http://www.chedong.com/phpMan.php/man/intro/3 比 http://www.chedong.com/phpMan.php?mode=man¶meter=intro§ion=3 更容易進入搜索引擎的索引。而且在URL中的命中有時候比在標(biāo)題中還能突出關(guān)鍵詞。
- 而且能夠進入Google索引的頁面數(shù)量越多越好?梢杂妙愃埔韵碌哪_本統(tǒng)計自己的網(wǎng)站被Google和百度索引的情況。
#!/bin/sh YESTERDAY=`date -d yesterday +%y%m%d` LOG_PATH='/home/apache/logs' grep -i Googlebot $LOG_PATH/access_log|awk '{print $7}' |sort -u>spider/$YESTERDAY.googlebot.txt grep -i baiduspider $LOG_PATH/access_log|awk '{print $7}' |sort -u>spider/$YESTERDAY.baiduspider.txt
- 網(wǎng)站目錄結(jié)構(gòu)要扁平,因為每深一級目錄,PAGERANK降低一個檔次。假設(shè)首頁是3,其子目錄就是2,更深可能就無法列入評級范圍了。
- 表現(xiàn)和內(nèi)容的分離:“綠色”網(wǎng)頁
網(wǎng)頁中的javascript和css盡可能和網(wǎng)頁分離,一方面提高代碼重用度(也方便頁面緩存),另外一方面,由于有效內(nèi)容占網(wǎng)頁長度的百分比高,也能提高相關(guān)關(guān)鍵詞在頁面中的比重也增加了。總之,應(yīng)該鼓勵遵循w3c的規(guī)范,使用更規(guī)范的XHTML和XML作為顯示格式便于內(nèi)容更長時間的保存。
- 讓所有的頁面都有能夠快速入口:站點地圖,方便網(wǎng)頁爬蟲(spider)快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。如果首頁就是用Flash或圖片進入的話,無異于將搜索引擎拒之門外,除了UI設(shè)計的用戶友好外,spider friendly也是非常重要的。
- 保持網(wǎng)站自身的健康:經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。
- 保持網(wǎng)頁內(nèi)容/鏈接的穩(wěn)定性和持久性:在搜索引擎索引中網(wǎng)頁存在的歷史也是一個比較重要的因素,而且歷史比較久的網(wǎng)頁被鏈接的幾率越高。為了保證自己網(wǎng)頁能夠被比較持久的被其他網(wǎng)站的頁面引用,如果自己網(wǎng)頁中有鏈接更新時,最好能保留舊的頁面并做好鏈接轉(zhuǎn)向,以保持內(nèi)容的連續(xù)性。要知道,把一個網(wǎng)站和內(nèi)容在搜索引擎中的排名“培養(yǎng)”的很高是一件非常不容易的事情,誰都不希望好不容易自己的內(nèi)容被別人找到了,點擊卻是“404 頁面不存在”吧,因此站點管理員對自身站點error.log的分析也是非常必要的。
- 文件類型因素:Google有對PDF, Word(Power Point, Excel), PS文檔的索引能力,由于這種文檔的內(nèi)容比一般的HTML經(jīng)過了更多的整理,學(xué)術(shù)價值一般比較高,所以這些類型的文檔天生就比一般的HTML類型的文檔 PageRank要高。因此,對于比較重要的文檔:技術(shù)白皮書,F(xiàn)AQ,安裝文檔等建議使用PDF PS等高級格式存取,這樣在搜索結(jié)果中也能獲得比較靠前的位置。
- 常常能發(fā)現(xiàn)門戶站點的一條新聞往往比其他站點的首頁排名還要靠前。因此一個站點總體PageRank提高了以后,往往自身一些并不重要的內(nèi)容也會被同那些高PageRank的內(nèi)容一起帶入被搜索引擎優(yōu)先查詢的列表中。這點有些不是很合理,因為這樣經(jīng)常造成很多大站點的郵件列表歸檔往往比其他站點的首頁PageRank還要高。
出處:
責(zé)任編輯:嘯
上一頁 如何突出關(guān)鍵詞 下一頁 知己知彼
|