作者相關(guān):http://blog.sina.com.cn/icecofee
準(zhǔn)確的說(shuō),就是利用日志中搜索引擎用戶的到訪統(tǒng)計(jì)分析來(lái)維護(hù)TAG。
TAG,可以用于活躍互動(dòng)、計(jì)算內(nèi)容類聚、在不能使用全文搜索的情況下用于用戶關(guān)注度高的內(nèi)容搜索,讓一些時(shí)間比較久的歷史熱門內(nèi)容仍然能被搜索引擎收錄。
但從目前情況看,問(wèn)題也是非常大的:1、除特定網(wǎng)站之外,用戶對(duì)創(chuàng)建TAG 全無(wú)經(jīng)驗(yàn),導(dǎo)致用戶創(chuàng)建的TAG 可利用性很差;2、按目前大部分網(wǎng)站的做法,TAG 的熱度初次生長(zhǎng)依賴網(wǎng)站編輯的經(jīng)驗(yàn),這樣,初始位置好的TAG 可能獲得較好的熱度生長(zhǎng)基礎(chǔ),不能真實(shí)反映TAG 的受歡迎情況。
可以使用這樣的辦法改進(jìn)目前的TAG 維護(hù)方式:從日志提取搜索引擎用戶使用的關(guān)鍵字作為TAG,并按搜索引擎用戶到訪的關(guān)鍵字熱度來(lái)維護(hù)排行,特定TAG 下的內(nèi)容排行也按搜索引擎用戶按該TAG 到訪情況排行,并使用與時(shí)間相關(guān)的算法讓歷史訪問(wèn)量衰減。
這樣做的好處:1、降低了用戶創(chuàng)建TAG 的技術(shù)要求,不需要用戶創(chuàng)建TAG,功能更傻瓜化。2、TAG 關(guān)聯(lián)的相關(guān)文章直接按搜索引擎用戶使用關(guān)鍵字到訪情況計(jì)算,使用的外部?jī)?yōu)化過(guò)的內(nèi)容排行,很大程度降低服務(wù)器開銷(很多小網(wǎng)站開銷不起相關(guān)文章的運(yùn)算)。3、TAG 熱度排行準(zhǔn)確性提高很多,使用搜索引擎用戶到訪的統(tǒng)計(jì)讓排行對(duì)內(nèi)部推薦的依賴程度降低。
實(shí)際上,利用外部搜索引擎降低網(wǎng)站服務(wù)器開銷已經(jīng)是很多網(wǎng)站都在采用的做法(有的web2.0 網(wǎng)站限于服務(wù)器條件,甚至連計(jì)數(shù)器都支持不好),比如說(shuō)搜索直接指向外部搜索引擎網(wǎng)站。而本文做法,不僅能顯著降低相關(guān)文章的索引開銷,更重要的是,這種開銷的降低不會(huì)影響網(wǎng)站被搜索引擎收錄(網(wǎng)絡(luò)推廣),也不會(huì)影響用戶訪問(wèn)的需要。
當(dāng)然,這個(gè)方法也有一個(gè)問(wèn)題,由于直接使用搜索引擎用戶到訪的排名來(lái)維護(hù)站內(nèi)TAG 頻道排名,熱度排行的進(jìn)化是一個(gè)加速進(jìn)化過(guò)程,會(huì)導(dǎo)致訪問(wèn)量向熱門內(nèi)容傾斜的比例更大。一個(gè)改進(jìn)的辦法是在熱門排行里適當(dāng)插入熱度低一層級(jí)的TAG 或內(nèi)容,甚至直接將最熱的十個(gè)(或二十個(gè))TAG 及內(nèi)容交換到次熱位置。這樣做的好處是可能能增加廣告的點(diǎn)擊率,最熱門內(nèi)容頁(yè)面上用戶過(guò)于關(guān)注內(nèi)容,對(duì)廣告可能熟視無(wú)睹,而冷門內(nèi)容頁(yè)面可能用戶停留時(shí)間短,次熱內(nèi)容頁(yè)上用戶停留時(shí)間足夠而無(wú)聊程度也足夠,不過(guò)次熱的標(biāo)準(zhǔn)要通過(guò)實(shí)踐摸索。
本文鏈接:http://www.95time.cn/tech/site/2007/4770.asp
出處:新浪科技
責(zé)任編輯:elesa
◎進(jìn)入論壇網(wǎng)站綜合、網(wǎng)頁(yè)制作版塊參加討論
|