中文字幕二区_国产精品免费在线观看_黄色网站观看_人人草人人澡_日本真实娇小xxxx

您的位置: 首頁 > 技術(shù)文檔 > 網(wǎng)絡(luò)編程 > 關(guān)于字符集和Unicode的相關(guān)知識
C# 3.5 WCF REST架構(gòu)簡單網(wǎng)站 回到列表 Visual Studio DSL 入門(一)
 關(guān)于字符集和Unicode的相關(guān)知識

作者:Joel Spolsky 時間: 2010-03-12 文檔類型:翻譯 來自:

第 1 頁 關(guān)于字符集和Unicode的相關(guān)知識 [1]
第 2 頁 關(guān)于字符集和Unicode的相關(guān)知識 [2]
第 3 頁 關(guān)于字符集和Unicode的相關(guān)知識 [3]
第 4 頁 關(guān)于字符集和Unicode的相關(guān)知識 [4]
第 5 頁 關(guān)于字符集和Unicode的相關(guān)知識 [5]

歷史回顧

可能你以為我要開始談非常古老的字符集如EBCDIC之類的,實際上我不會。EBCDIC與你的生活無關(guān),我們不需要回到那么遠(yuǎn)。

ascii.png

回到一般遠(yuǎn)就行了。當(dāng)Unix剛出來的時候,K&R寫了《The C Programming Language》一書,那時一切都很簡單。EBCDIC已經(jīng)慚慚不用,因為需要表示的字符只有那些不帶重音的英文字母,ASCII完全可以勝任。ASCII使用數(shù)字32到 127來表示所有的英文字母,比如空格是32,字母"A"是65等等。使用7個比特就可以存儲所有這樣字符。那個時代的大多數(shù)計算機(jī)使用8個比特來,所以你不但可以存儲全部的ASCII,而且還有一個比特可以多出來用作其他。如果你想,你可以把它用作你不可告人的目的。32以下的碼字是不可打印的,它們屬于控制字符,像7表示響鈴,12表示打印機(jī)換紙。

所有的一切都看起來那么完美,當(dāng)然前提你生在一個講英文的國家。

oem.png

因為一個字節(jié)有8個比特,而現(xiàn)在只用了7個,于是很多人就想到"對呀,我們可以使用128-255的碼字來表示其他東西"。麻煩來了,這么多人同時出現(xiàn)了這樣的想法,而且將之付諸實踐。于是IBM-PC上多了一個叫OEM字符集的東西,它包括了一些在歐洲語言中用到的重音字符,還有一些畫圖的字符,比如水平線、垂直線等,水平線在右端會帶一個小彎鉤,垂直線會如何等等。使用這些畫圖字符你可以畫出漂亮的框、畫出光滑的線條,在老式的烘干機(jī)上的8088電腦上你依然可以看到這些字符。事實上,當(dāng)PC在美國之外的地方開始銷售的時候,OEM字符集就完全亂套了,所有的廠商都開始按照自己的方式使用高128個碼字。比如在有些PC上,130表示é,而在另外一些在以色列出售的計算機(jī)上,它可能表示的是希伯來字母ג,所以當(dāng)美國人把包含résumés這樣字符的郵件發(fā)到以色列時,就為變?yōu)閞גsumגs。在大多數(shù)情況下,比如俄語中,高128個碼字可能用作其他更多的用途,那么你如何保證俄語文檔的可靠性呢?

最終ANSI標(biāo)準(zhǔn)結(jié)束了這種混亂。在標(biāo)準(zhǔn)中,對于低128個碼字大家都無異議,差不多就是ASCII了,但對于高128個碼字,根據(jù)你所在地的不同,會有不同的處理方式。我們稱這樣相異的編碼系統(tǒng)為碼頁(code pages)。舉個例子,比如在以色列發(fā)布的DOS中使用的碼頁是862,而在希臘使用的是737。它們的低128個完全相同,但從128往上,就有了很大差別。MS-DOS的國際版有很多這樣的碼頁,涵蓋了從英語到冰島語各種語言,甚至還有一些"多語言"碼頁。但是還得說,如果想讓希伯來語和希臘語在同一臺計算機(jī)上和平共處,基本上沒有可能。除非你自己寫程序,程序中的顯示部分直接使用位圖。因為希伯來語對高128個碼字的解釋與希臘語壓根不同。

同時,在亞洲,更瘋狂的事情正在上演。因為亞洲的字母系統(tǒng)中要上千個字母,8個比特?zé)o論如何也是滿足不了的。一般的解決方案就是使用DBCS- "雙字節(jié)字符集",即有的字母使用一個字節(jié)來表示,有的使用兩個字節(jié)。所以處理字符串時,指針移動到下一個字符比較容易,但移動到上一個字符就變得非常危險了。于是s++或s--不再被鼓勵使用,相應(yīng)的比如Windows下的AnsiNext和AnsiPrev被用來處理這種情況。

可惜,不少人依然堅信一個字節(jié)就是一個字符,一個字符就是8個比特。當(dāng)然,如果你從來都沒有試著把一個字符串從一臺計算機(jī)移到另一臺計算機(jī),或者你不用說除英文以外的另一種語言,那么你的堅信不會出問題。但是互聯(lián)網(wǎng)出現(xiàn)讓字符串在計算機(jī)間移動變得非常普遍,于是所有的混亂都爆發(fā)了。非常幸運,Unicode適時而生。

出處:
責(zé)任編輯:bluehearts

上一頁 關(guān)于字符集和Unicode的相關(guān)知識 [1] 下一頁 關(guān)于字符集和Unicode的相關(guān)知識 [3]

◎進(jìn)入論壇網(wǎng)絡(luò)編程版塊參加討論

相關(guān)文章
任意字符集下正常顯示網(wǎng)頁
Flash與后臺編碼問題解決新方案
關(guān)鍵字搜索 常規(guī)搜索 推薦文檔
熱門搜索:CSS Fireworks 設(shè)計比賽 網(wǎng)頁制作 web標(biāo)準(zhǔn) 用戶體驗 UE photoshop Dreamweaver Studio8 Flash 手繪 CG
站點最新 站點最新列表
周大!熬•自然”設(shè)計大賽開啟
國際體驗設(shè)計大會7月將在京舉行
中國國防科技信息中心標(biāo)志征集
云計算如何讓安全問題可控
云計算是多數(shù)企業(yè)唯一擁抱互聯(lián)網(wǎng)的機(jī)會
阿里行云
云手機(jī)年終巨獻(xiàn),送禮標(biāo)配299起
阿里巴巴CTO王堅的"云和互聯(lián)網(wǎng)觀"
1499元買真八核 云OS雙蛋大促
首屆COCO桌面手機(jī)主題設(shè)計大賽
欄目最新 欄目最新列表
淺談JavaScript編程語言的編碼規(guī)范
如何在illustrator中繪制臺歷
Ps簡單繪制一個可愛的鉛筆圖標(biāo)
數(shù)據(jù)同步算法研究
用ps作簡單的作品展示頁面
CSS定位機(jī)制之一:普通流
25個最佳最閃亮的Eclipse開發(fā)項目
Illustrator中制作針線縫制文字效果
Photoshop制作印刷凹凸字體
VS2010中創(chuàng)建自定義SQL Rule
>> 分頁 首頁 前頁 后頁 尾頁 頁次:2/51個記錄/頁 轉(zhuǎn)到 頁 共5個記錄

藍(lán)色理想版權(quán)申明:除部分特別聲明不要轉(zhuǎn)載,或者授權(quán)我站獨家播發(fā)的文章外,大家可以自由轉(zhuǎn)載我站點的原創(chuàng)文章,但原作者和來自我站的鏈接必須保留(非我站原創(chuàng)的,按照原來自一節(jié),自行鏈接)。文章版權(quán)歸我站和作者共有。

轉(zhuǎn)載要求:轉(zhuǎn)載之圖片、文件,鏈接請不要盜鏈到本站,且不準(zhǔn)打上各自站點的水印,亦不能抹去我站點水印。

特別注意:本站所提供的攝影照片,插畫,設(shè)計作品,如需使用,請與原作者聯(lián)系,版權(quán)歸原作者所有,文章若有侵犯作者版權(quán),請與我們聯(lián)系,我們將立即刪除修改。

您的評論
用戶名:  口令:
說明:輸入正確的用戶名和密碼才能參與評論。如果您不是本站會員,你可以注冊 為本站會員。
注意:文章中的鏈接、內(nèi)容等需要修改的錯誤,請用報告錯誤,以利文檔及時修改。
不評分 1 2 3 4 5
注意:請不要在評論中含與內(nèi)容無關(guān)的廣告鏈接,違者封ID
請您注意:
·不良評論請用報告管理員,以利管理員及時刪除。
·尊重網(wǎng)上道德,遵守中華人民共和國的各項有關(guān)法律法規(guī)
·承擔(dān)一切因您的行為而直接或間接導(dǎo)致的民事或刑事法律責(zé)任
·本站評論管理人員有權(quán)保留或刪除其管轄評論中的任意內(nèi)容
·您在本站發(fā)表的作品,本站有權(quán)在網(wǎng)站內(nèi)轉(zhuǎn)載或引用
·參與本評論即表明您已經(jīng)閱讀并接受上述條款
推薦文檔 | 打印文檔 | 評論文檔 | 報告錯誤  
專業(yè)書推薦 更多內(nèi)容
網(wǎng)站可用性測試及優(yōu)化指南
《寫給大家看的色彩書1》
《跟我去香港》
眾妙之門—網(wǎng)站UI 設(shè)計之道
《Flex 4.0 RIA開發(fā)寶典》
《贏在設(shè)計》
犀利開發(fā)—jQuery內(nèi)核詳解與實踐
作品集 更多內(nèi)容

雜⑦雜⑧ Gold NORMANA V2