大五碼(Big5),又稱為五大碼,是使用繁體中文社群中最常用的電腦漢字字符集標(biāo)準(zhǔn),共收錄13,060個(gè)中文字,其中有二字為重覆編碼,Big5屬中文內(nèi)碼(中文碼分為中文內(nèi)碼及中文交換碼兩類)。Big5雖普及于臺灣、香港與澳門等繁體中文通行區(qū),但長期以來并非當(dāng)?shù)氐膰覙?biāo)準(zhǔn),而只是業(yè)界標(biāo)準(zhǔn)(de
facto standard)。倚天中文系統(tǒng)、Windows等主要系統(tǒng)的字符集都是以Big5為基準(zhǔn),但廠商又各自增刪,衍生成多種不同版本。
“五大碼”(Big5)是在1984年由臺灣地區(qū)財(cái)團(tuán)法人信息工業(yè)策進(jìn)會為五大中文套裝軟件(宏碁、神通、佳佳、零壹、大眾)所設(shè)計(jì)的中文內(nèi)碼,所以就稱為Big5中文內(nèi)碼,雖然五大套裝軟件并沒有成功,但Big5碼卻深遠(yuǎn)地影響正體中文電腦內(nèi)碼,直至今日!拔宕蟠a”的英文名稱“Big5”后來被人按英文字序譯回中文,以致現(xiàn)在有“五大碼”和“大五碼”兩個(gè)中文名稱。
Big5碼的產(chǎn)生,是因?yàn)楫?dāng)時(shí)臺灣不同廠商各自推出不同的編碼,如IBM
5550、王安碼等,彼此不能兼容;另一方面,臺灣當(dāng)時(shí)尚未推出官方的漢字編碼,而中國大陸所推行的GB
2312編碼,亦未有收錄繁體字。在這樣的時(shí)空背景下,為了使臺灣早日進(jìn)入信息時(shí)代,所采行的一個(gè)計(jì)劃;同時(shí),這個(gè)計(jì)劃對于以臺灣為核心的亞洲繁體漢字圈也產(chǎn)生了久遠(yuǎn)的影響。
Big5碼由于很多日常用字被視為異體字而未收錄。很多人,甚至電視臺的字幕、報(bào)紙的用字習(xí)慣都被改變。
由于Big5碼內(nèi)的萬多個(gè)字,只是根據(jù)臺灣地區(qū)“教育部”頒布的《常用國字標(biāo)準(zhǔn)字體表》、《次常用國字標(biāo)準(zhǔn)字體表》等用字匯編而成,并沒有考慮社會上流通的人名、地名用字、方言用字、化學(xué)及生物科等用字,亦沒有放入日語平假名及片假名字母。所以在市面上支援Big5碼的軟件,有不少都自行在原本的編碼外,添加一些符號及用字。
中文數(shù)位化技術(shù)推廣委員會(中推會)在1997年推出Big5+,使用了兩萬多碼位,納入了Unicode
1.1下所有漢字。由于編碼使用到的范圍超過原先Big5定義(Big5+使用了高字節(jié)0x81-0xFE,低字節(jié)0x40-0x7E、0x80-0xFE),無法安裝在Microsoft
Windows上,現(xiàn)幾乎無人使用。
鑒于Big5不是一個(gè)官方標(biāo)準(zhǔn),中推會決定編制一個(gè)Big5的定義,并把它放到官方編碼CNS
11643的附錄里,正式成為官方標(biāo)準(zhǔn)的一部分。
由于各廠商及政府推出的Big5延伸,彼此互不兼容,造成亂碼問題。鑒于Unicode能正確地處理七萬多個(gè)漢字,近年的操作系統(tǒng)和應(yīng)用程式(如蘋果電腦
Mac OS X 和以 Cocoa API 撰寫之程式、Microsoft
Windows 2000及之后版本、Microsoft Office 2000及之后版本、Mozilla瀏覽器、Internet
Explorer瀏覽器、Java 語言等等),已改用Unicode編碼。可惜現(xiàn)時(shí)仍有一些舊的軟件(如Visual
Basic 6、部分Telnet或BBS軟件),未能支援Unicode編碼,故相信Big5缺字的問題仍會困擾用戶一段時(shí)間,直至所有程式都能改用Unicode為止。
|