重新索引互聯(lián)網(wǎng) Facebook 雇傭公關抹黑 Google 的過程已經(jīng)水落石出。問題是: Google 那么多產(chǎn)品, Facebook 為何對 Social Circle 這么敏感?
Google :索引互聯(lián)網(wǎng)
Google 號稱自己的使命是“索引互聯(lián)網(wǎng)”。
這件事的難點并非派出多少爬蟲,而是對收集來的海量內(nèi)容做排序:怎樣讓真正重要的網(wǎng)頁,的排到 Google 搜索結(jié)果的前面來?
Google 的搜索結(jié)果排序有其他算法的輔助和人工調(diào)整,但是,他最基本的核心規(guī)則還是 Pagerank ,其理念并不復雜: “被許多優(yōu)質(zhì)網(wǎng)頁引用的網(wǎng)頁,仍然是優(yōu)質(zhì)網(wǎng)頁!
領域
Pagerank 是革命性的。而另一場革命似乎被我們忽視了: Tags 。
語義網(wǎng)絡長期不靠譜的忽悠之后,簡單的 Tags 可以終于可以給我們一些東西,讓我們分辨這個網(wǎng)頁是關于哪些方面的。從此“領域”也被引入網(wǎng)絡。
具體些的“領域”的例子,就是 Quora 或者 Stack Overflow 的 Tags 。問題本身是屬于“技術”領域,還是“設計”領域?是關于“ J2EE ”領域,還是“ Object-C ”領域?
某些沒有 Tag 化的網(wǎng)頁到底屬于什么領域,還沒有清晰的答案。但是已經(jīng)有人在嘗試解決這些問題。比如豆瓣九點,他是依靠算法來給 Blog 自動分類的。
出處:ifanr
責任編輯:bluehearts
上一頁 下一頁 重新索引互聯(lián)網(wǎng) [2]
◎進入論壇網(wǎng)站綜合、網(wǎng)頁制作版塊參加討論
|