上一页

ⓘ KS X 1001




                                     

ⓘ KS X 1001

English version: KS X 1001

KS X 1001 是韓國用於書寫的諺文和漢字的字元編碼規格。以前稱作 KS C 5601 ,現在多稱作KS X 1001,有时也简称为KS編碼。

其与JIS X 0208的94×94字集类似,包含諺文2350字、漢字4888字、英文字母、數字和假名共8226字。諺文是由字母組合成一个音節的,但在这种编码中用一个字符表示一整个音节,难以包括所有可能的組成符號,存在許多無法表示的音節,受到許多批評。百事可樂的韓國法人因 KS X 1001 不含「 펲 」,在1992年改用 KS X 1001 中存在的諺文「 펩 」表示。

漢字則是照讀音順序來配置的。朝鮮語原則上一字一音,但也存在破音字,KS X 1001對這樣的漢字在不同的读音位置重複編碼。

雖然也有不一樣的,使用頭音法則,即轉成最先遇到的那個讀音,但如「 盧 」和「 李 」如此常用的字也有別的讀音和重複編碼。最多的是有4個重複編碼的「 樂 」。這個方式的好處是、字的讀音利於機械的判定,但卻也被批評違反字符編碼的大原則。此外,這樣重複編碼的漢字在統一碼和通用字符集中因互換性的關係,中日韓統一表意文字只收錄一個、其它的則收錄於中日韓兼容漢字。

KS X 1001在EUC的編碼稱作 韓文EUC ( EUC-KR )。實際上,KS X 1001 完全沒有被用於其它編碼(ISO-2022-KR完全沒有被使用),單獨的 KS C 5601 通常意指 EUC-KR 。

一些電腦系統将此標準改編成诸多版本。但他們並非完全一致,如將原标准中放在 0x5C 的反斜線改成韓圓(₩)。有些系統則使用非常規方法來擴充此標準。KS X 1001 可編碼成 EUC-KR、Windows-949(EUC-KR 的超集)、ISO-2022-KR 和「雙位元組合型符號」(Johab)。但後二個很少使用。

朝鮮則使用另一規格KPS 9566。

                                     

1. 歷史

  • 1997年8月20日 - 伴隨新的情報部門X的設立,KS C 5601 改為 KS X 1001 。
  • 1998年12月31日 - 修改 KS X 1001,增加歐元符號(€)和註冊商標符號(®)。
  • 1992年10月15日 - 修訂 KS C 5601。附錄中「16位元符號」變更為「雙位元組合型符號」。表示的碼點和初聲、中聲、終聲一樣,位元型式則完全不同。
  • 1987年3月1日 - KS C 5601再次修訂,7 位元諺文碼和「十六位元符號」移動到附錄。本文定為94×94文字集合,含有2350個諺文字符、4888個漢字、986個其他文字。
  • 1982年6月14日 - 修訂 KS C 5601。增加「十六位元符號」附錄。「十六位元符號」為初聲、中聲、終聲各5 位元的表示。最高位元為 1 的編碼。
  • 1974年9月27日 - 制訂 KS C 5601 為 7 位元諺文編碼。當時的配置為30個諺文子音字母(頭子音和終子音的集合)在 0x41-0x5E ,21個母音字母散佈在 0x62 - 0x7C 。這種系統無法區別頭子音和終子音。
                                     

2. 另見

  • 大五碼
  • 中日韓統一表意文字
  • GB 2312
  • JIS X 0208
  • GB 12052信息交换用朝鲜文字编码字符集
                                     
  • 11643 U FA0C - U FA0D 2個於原字集重複了的字 日本IBM 32 CP932變種 U FA0E - U FA2D 32個字 南韓 KS X 1001 2004 U FA2E - U FA2F 2個字 日本JIS X 0213 U FA30 - U FA6A 59個字 ARIB STD - B24 U FA6B - U FA6D 3個字
  • 12052 - 89 朝鲜的KPS 9566 韩国的 KS X 1001 即 KS C 5601 相比而言韩国的 KS X 1001 应用最为广泛 现在由于Unicode的出现 朝鲜文有了统一的Unicode编码 这样对于朝鲜文的信息交换也会更方便 国家标准代码 GB 2312 KS X 1001 GB 12052 - 89与Unicode对照表
  • 9566 - 2000的唯一字符編碼為EUC - KP 這是類似於EUC - KR 修改 KS X 1001 而來的 但因完全沒有支援KPS 9566的程式 反倒多為國際標準做為參考用 KPS 9566 - 2000 是 94 94 的碼 除去列來說 構造 與 KS X 1001 類似 0 x 21 0 x 2C:
  • KS X 1001 1998 U F900 - U FA0B 268個字 台灣Big5 U FA0C - U FA0D 2個字 日本IBM 32 CP932變種 U FA0E - U FA2D 32個字 南韓 KS X 1001 2004 U FA2E - U FA2F個字 日本JIS X
  • 第一位字节 使用0 x 8F 第二位字节 使用0xA1 - 0xFE 第三位字节 使用0xA1 - 0xFE EUC - KR用来储存韩国 KS X 1001 字集 旧称 KS C 5601 的字符 此规格由 KS X 2901 旧称 KS C 5861 定义 KS X 1001 字元使用两个字节来表示 高位字节 使用0xA1 - 0xFE
  • 黑体及思源宋体是为了呼應统一设计的需求 以服务于东亚15亿人口 並依照當地語系國家的標準規範 如日文採用日本JIS X 0208及JIS 2004 韓文採用 KS X 1001 及 KS X 1002標準 正體中文支援Big5並根據中華民國教育部國字標準字體造字 簡體中文以中華人民共和國的GB 18030及通用規範漢字表規範製作
  • 转为JIS X 0213 - 2000第二字面 ISO - 2022 - JP - 2004 - 于ISO - 2022 - JP - 3的基础上 加上以下一组逃逸字串 ESC Q 转为JIS X 0213 - 2004第一字面 ISO - 2022 - KR - 朝鲜文 ESC C 转为 KS X 1001 - 1992 ISO - 2022 - CN
  • KS X 1001 和 KS X 1002 所規定的字形 通常可以被直接作爲 舊字形 使用 但某些字形並不符合康熙字典體 如 言 的首筆作豎 一些 儿 構件誤作 几 構件等 日本頒佈 JIS X 0218 而後擴充爲 JIS X 2013 前使用的字形 但在 2004 年修訂頒佈 JIS X 0213: 2004
  • 橙色文字標示的是未來的Unicode 5.2會加入的新字母 淡紫紅色的區點標示的是在Unicode 5.1及 KS X 1026曾修訂過的區點 捷徑: ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅅ ㅿ ㅇ ㆁ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ ㆆ 捷徑: ㅏ ㅑ ㅓ ㅕ ㅗ ㅛ ㅜ ㅠ ㅡ
  • 查 论 编 韩语字母 諺文 單字母 複合字母 編碼 KS X 1001 諺文相容字母 Microsoft code page 949 諺文字母列表 訓民正音 古諺文
  • 查 论 编 韩语字母 諺文 單字母 複合字母 編碼 KS X 1001 諺文相容字母 Microsoft code page 949 諺文字母列表 訓民正音 古諺文
  • 查 论 编 韩语字母 諺文 單字母 複合字母 編碼 KS X 1001 諺文相容字母 Microsoft code page 949 諺文字母列表 訓民正音 古諺文