一、測試目的
為了客觀評價各種中文檢索功能和性能指標,作為國家數字圖書館檢索系統選型的依據,特公開邀請各檢索系統供應商參加此項測試。
二、測試時間
經初篩后,另行通知候選參測單位。
三、測試要求
針對國家圖書館二期工程暨國家數字圖書館工程的數據情況,建立適當的檢索系統。要求該檢索系統:
(1)支持二次文獻(元數據)的字段檢索、字段級的“與或非”組合檢索以及全文檢索;
(2)建立2千萬條元數據,1千個并發檢索用戶的計算機體系結構進行測試,根據測試結果推演5.5億條元數據,1萬個并發檢索用戶的情況下,秒級響應所需要的的計算機體系結構;
(3)具有良好的可擴展性和推演能力;
(4)支持Unicode 4.0/ISO10646:2003標準字符集;
(5)能夠從各種字符集標準自動轉換成Unicode 4.0/ISO10646:2003標準字符集。
(6)支持集群系統。
四、測試環境
1、硬件平臺
曙光4000 H,由2個服務器節點(帶硬盤)和16個刀片服務器(無硬盤)構成,配置分別如下:
4000H節點的配置(2個節點)
2顆 CPU Intel(R) Xeon(TM) 2.80GHz,cache size 512KB
內存 8GB
硬盤 133GB
刀片服務器(16個節點)
無盤工作站
2顆CPU Intel(R) Xeon(TM) 2.80GHz,cache size 512KB
內存4GB
2、測試數據
國家圖書館提供的數據總量為2千萬條元數據,包括:
(1) 中文目次數據(數據格式ISO 2709)(GBK)
(2) 西文目次數據(數據格式SGML)
(3) EBSCO數據(數據格式SGML)
(4) CNMARC數據(數據格式ISO 2709)
(5) USMARC數據(數據格式ISO 2709)
(6) 全文數據(數據格式GB 2312)
注意:測試廠商需要事前轉換數據到utf-8編碼。
五、測試方法與步驟
1、測試步驟
(1) 愿意參加測試的供應商請填寫測試申請表(見附件),同時提供其軟件的主要功能、性能、應用接口情況、數據格式和標準、外部接口等說明;提供主要用戶名單,及用戶聯系方式,并對數據規模,系統部署結構,遵循的標準規范等進行說明;
(2) 國家圖書館對測試申請表及提交的其他資料進行初篩。將從軟件功能、使用情況、數據規模的經驗、使用方式的相似性、系統部署結構的能力等方面進行考察,選擇參加實際測試試驗的單位;
(3) 向通過初篩的參測單位發《工程檢索系統測試方案》,召開測試方法說明會,并安排進入測試現場的順序,在指定的測試系統上現場測試,每個測試單位的測試時間控制在五個工作日之內;
(4) 分別與各參測單位討論測試結果集和系統構成方案;
(5) 根據數據檢索能力、系統結構、推演結果、擴充的方式與方法等方面,最終評定各參測單位軟件測試結果的優劣順序。
2、說明
(1) 遞交申請截止日期為2005年6月15日;
(2) 測試地點設在中國科學院計算技術研究所;
(3) 測試方法詳見《工程檢索系統測試方案》。
|