• <menu id="euueg"><nav id="euueg"></nav></menu>
         您的位置:首頁 > 國家數字圖書館工程 > 標準規范
     

    漢 字 處 理 規 范

    ·漢字屬性字典

        漢字屬性字典規范要求處理的漢字范圍為GB 18030-2005(UNICODE、ISO 10646-2003)所包括的全部漢字。漢字屬性字典規范的基本內容是漢字字型標準化、漢字標準發音、字型特征(包括漢字總筆畫數量、漢字起筆至末筆筆形值、部首筆畫數量、部首序號、部首外起筆至末筆筆形值、異體字數量、異體字字型等)、各種編碼(包括四角號碼、輸入編碼、其他漢字字符集編碼等)以及構詞和使用頻度等。
        委托研制單位:中華書局
        預計完成時間:2008年9月

     

    ·中文文獻全文版式還原與全文輸入XML規范

        中文文獻全文版式還原與全文輸入XML規范要求能夠對全部中文文獻進行詳細標記說明(主要用于古籍文獻,兼顧普通文獻),形成中文文獻全文版式還原與全文輸入XML規范格式,能夠實現在互聯網上全方位、實時再現中文文獻原貌(重點是古籍),能夠支持系統字與系統外字描述,能夠提供全文檢索所需信息,能夠進行中文文獻長期存儲與保存。
        委托研制單位:北京中易中標電子信息技術有限公司
        預計完成時間:2008年9月

    ·古籍用字規范(計算機用字標準)

        古籍用字規范要求處理的漢字范圍大于GB 18030-2005(UNICODE、ISO 10646-2003),要求處理與古籍相關的全部漢字(超出部分需要造字)。古籍用字規范的基本內容是漢字字型標準化、漢字發音(包括標準發音、上古音、中古音、近古音)、字型特征(包括漢字總筆畫數量、漢字起筆至末筆筆形值、部首筆畫數量、部首序號、部首外起筆至末筆筆形值、異體字數量、異體字字型等)、各種編碼(包括四角號碼、輸入編碼、其他漢字字符集編碼等)以及構詞和使用頻度等。
        委托研制單位:中華書局
        預計完成時間:2008年9月

    ·計算機中文信息處理規范

        計算機中文信息處理規范要求處理的漢字范圍為GB 18030-2005(UNICODE、ISO 10646-2003)所包括的全部漢字。計算機中文信息處理規范的基本內容是對文件格式、存儲格式、傳輸格式、文獻排序規則、檢索處理能力、全文顯示能力的規范等。
        委托研制單位:北京中易中標電子信息技術有限公司
        預計完成時間:2008年9月

    ·生僻字、避諱字處理規范

        生僻字、避諱字處理規范要求處理的漢字范圍大于GB 18030-2005(UNICODE、ISO 10646-2003),要求處理與生僻字、避諱字相關的全部漢字。生僻字、避諱字處理規范的基本內容是漢字字型標準化、漢字發音(包括標準發音、上古音、中古音、近古音)、字型特征(包括漢字總筆畫數量、漢字起筆至末筆筆形值、部首筆畫數量、部首序號、部首外起筆至末筆筆形值、異體字數量、異體字字型等)、各種編碼(包括四角號碼、輸入編碼、其他漢字字符集編碼等)以及構詞和使用頻度等。
        委托研制單位:中華書局
        預計完成時間:2008年9月

     

     
    國家圖書館版權所有
    办公室粗喘呻吟宝贝再快点
  • <menu id="euueg"><nav id="euueg"></nav></menu>