中文字幕二区_国产精品免费在线观看_黄色网站观看_人人草人人澡_日本真实娇小xxxx

您的位置: 首頁 > 技術文檔 > 網絡編程 > 網站生成靜態(tài)頁面攻略
幾行代碼搞定一棵漂亮的樹 回到列表 JavaBean與EJB有何不同之處
 網站生成靜態(tài)頁面攻略

作者:zkq0 時間: 2005-11-30 文檔類型:原創(chuàng) 來自:藍色理想

第 1 頁 生成靜態(tài)頁面的方法
第 2 頁 數(shù)據(jù)采集
第 3 頁 防采集策略
第 4 頁 防采集而不防搜索引擎策略

從前面的我講的采集原理大家可以看出,絕大多數(shù)采集程序都是靠分析規(guī)則來進行采集的,如分析分頁文件名規(guī)則、分析頁面代碼規(guī)則。

一、分頁文件名規(guī)則防采集對策

大部分采集器都是靠分析分頁文件名規(guī)則,進行批量、多頁采集的。如果別人找不出你的分頁文件的文件名規(guī)則,那么別人就無法對你的網站進行批量多頁采集。

實現(xiàn)方法:

我認為用MD5加密分頁文件名是一個比較好的方法,說到這里,有人會說,你用MD5加密分頁文件名,別人根據(jù)此規(guī)則也可以模擬你的加密規(guī)則得到你的分頁文件名。

我要指出的是我們加密分頁文件名時,不要只加密文件名變化的部分

如果I代表分頁的頁碼,那么我們不要這樣加密:page_name=Md5(I,16)&".htm"

最好給要加密的頁碼上再跟進一個或多個字符,如:page_name=Md5(I&"任意一個或幾個字母",16)&".htm"

因為MD5是無法反解密的,別人看到的會頁字母是MD5加密后的結果,所以加人也無法知道你在 I 后面跟進的字母是什么,除非他用暴力****MD5,不過不太現(xiàn)實。

二、頁面代碼規(guī)則防采集對策

如果說我們的內容頁面無代碼規(guī)則,那么別人就無法從你的代碼中提取他們所需要的一條條內容。所以我們要的這一步做到防采集,就要使代碼無規(guī)則。

實現(xiàn)方法:

使對方需要提取的標記隨機化

1、定制多個網頁模板,每個網頁模板里的重要HTML標記不同,呈現(xiàn)頁面內容時,隨機選取網頁模板,有的頁面用CSS+DIV布局,有的頁面用table布局,此方法是麻煩了點,一個內容頁面,要多做幾個模板頁面,不過防采集本身就是一件很煩瑣的事情,多做一個模板,能起到防采集的作用,對很多人來說,都是值得的。
2、如果嫌上面的方法太麻煩,把網頁里的重要HTML標記隨機化,也可以。

做的網頁模板越多,html代碼越是隨機化,對方分析起內容代碼時,就越麻煩,對方針對你的網站專門寫采集策略時,難度就更大,在這個時候,絕大部分人,都會知難而退,因為這此人就是因為懶,才會采集別人網站數(shù)據(jù)嘛~~~再說一下,目前大部分人都是拿別人開發(fā)的采集程序去采集數(shù)據(jù),自己開發(fā)采集程序去采集數(shù)據(jù)的人畢竟是少數(shù)。

還有些簡單的思路提供給大家:

1、把對數(shù)據(jù)采集者重要,而對搜索引擎不重要的內容用客戶端腳本顯示
2、把一頁數(shù)據(jù),分為N個頁面顯示,也是加大采集難度的方法
3、用更深層的連接,因為目前大部分采集程序只能采集到網站內容的前3層,如果內容所在的連接層更深,也可以避免被采集。不過這樣可能會給客戶造成瀏覽上的不便。如:

大多網站都是 首頁----內容索引分頁----內容頁
如果改成:
首頁----內容索引分頁----內容頁入口----內容頁
注:內容頁入口最好能加上自動轉入內容頁的代碼

<meta http-equiv="refresh" content="6;url=內容頁(http://www.xiaoqi.net)">

其實,只要做好防采集的第一步(加密分頁文件名規(guī)則),防采集的效果就已經不錯了,還是建議兩條反采集方法同時使用,給采集者增加采集難度,使得他們知難頁退。

出處:藍色理想
責任編輯:moby

上一頁 防采集策略 下一頁

◎進入論壇網絡編程版塊參加討論

相關文章 更多相關鏈接
國內首家中文GoLive CS2視頻教程
網站設計制作開發(fā)漫談
有中國特色的網站首頁
圖行天下:本地搜索網站一覽
KIA ?嵊欣,有力
關鍵字搜索 常規(guī)搜索 推薦文檔
熱門搜索:CSS Fireworks 設計比賽 網頁制作 web標準 用戶體驗 UE photoshop Dreamweaver Studio8 Flash 手繪 CG
站點最新 站點最新列表
周大!熬•自然”設計大賽開啟
國際體驗設計大會7月將在京舉行
中國國防科技信息中心標志征集
云計算如何讓安全問題可控
云計算是多數(shù)企業(yè)唯一擁抱互聯(lián)網的機會
阿里行云
云手機年終巨獻,送禮標配299起
阿里巴巴CTO王堅的"云和互聯(lián)網觀"
1499元買真八核 云OS雙蛋大促
首屆COCO桌面手機主題設計大賽
欄目最新 欄目最新列表
淺談JavaScript編程語言的編碼規(guī)范
如何在illustrator中繪制臺歷
Ps簡單繪制一個可愛的鉛筆圖標
數(shù)據(jù)同步算法研究
用ps作簡單的作品展示頁面
CSS定位機制之一:普通流
25個最佳最閃亮的Eclipse開發(fā)項目
Illustrator中制作針線縫制文字效果
Photoshop制作印刷凹凸字體
VS2010中創(chuàng)建自定義SQL Rule
>> 分頁 首頁 前頁 后頁 尾頁 頁次:4/41個記錄/頁 轉到 頁 共4個記錄

藍色理想版權申明:除部分特別聲明不要轉載,或者授權我站獨家播發(fā)的文章外,大家可以自由轉載我站點的原創(chuàng)文章,但原作者和來自我站的鏈接必須保留(非我站原創(chuàng)的,按照原來自一節(jié),自行鏈接)。文章版權歸我站和作者共有。

轉載要求:轉載之圖片、文件,鏈接請不要盜鏈到本站,且不準打上各自站點的水印,亦不能抹去我站點水印。

特別注意:本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯(lián)系,版權歸原作者所有,文章若有侵犯作者版權,請與我們聯(lián)系,我們將立即刪除修改。

您的評論
用戶名:  口令:
說明:輸入正確的用戶名和密碼才能參與評論。如果您不是本站會員,你可以注冊 為本站會員。
注意:文章中的鏈接、內容等需要修改的錯誤,請用報告錯誤,以利文檔及時修改。
不評分 1 2 3 4 5
注意:請不要在評論中含與內容無關的廣告鏈接,違者封ID
請您注意:
·不良評論請用報告管理員,以利管理員及時刪除。
·尊重網上道德,遵守中華人民共和國的各項有關法律法規(guī)
·承擔一切因您的行為而直接或間接導致的民事或刑事法律責任
·本站評論管理人員有權保留或刪除其管轄評論中的任意內容
·您在本站發(fā)表的作品,本站有權在網站內轉載或引用
·參與本評論即表明您已經閱讀并接受上述條款
推薦文檔 | 打印文檔 | 評論文檔 | 報告錯誤  
專業(yè)書推薦 更多內容
網站可用性測試及優(yōu)化指南
《寫給大家看的色彩書1》
《跟我去香港》
眾妙之門—網站UI 設計之道
《Flex 4.0 RIA開發(fā)寶典》
《贏在設計》
犀利開發(fā)—jQuery內核詳解與實踐
作品集 更多內容

雜⑦雜⑧ Gold NORMANA V2