史志检索系统产品白皮书

信息发布时间:   信息浏览次数:1048


 

一、     问题提出

异构数据增量存储,如何确保内容有效利用、有序有效扩展?

 

《浙江通志库》全文检索系统,是利用国际先进技术开发而成的全文检索系统,库中已经收录了(清)雍正《浙江通志》、(民国)《浙江通志稿》。

 

二、      系统意义

一是推进全省地情库建设:浙江省方志办有待存入到地情库的内容有文字、图片、视频、音频等内容,总的储存量达到20TB左右,相当于600多万套《资治通鉴》的文字量,通过地情库库建设,可实现依照统一的规范,多维度对成果进行管理,便于今后的利用开发。

二是开辟全省地情利用:在修志过程中,资料收集及考订需要花费巨大的人力和物力,有了基于地情的检索系统,可大大加快资料收集的速度及质量。

三是为创新资政模式:未来还可将某一数据挖掘的模型内置到系统中,如将空间设为绍兴,时间轴设为1573-1620,中心关键词为农业产量,关联词设为人口、耕地面积、税收、气象、病疫、战乱等作为数据挖掘条件,检索结果就是一篇“明万历年间绍兴农业发展剖析”论文的雏形;同理,也可以得到一个“建国后20年间绍兴农业发展剖析” 的论文雏形,进而形成历史比较分析,为资政决策等提供支持。

总之,市面上的检索系统产品不少,而基于方志特色的检索系统并不多见,该系统的开通及推广,对我省在落实地方志十三五规划,践行“落在实处、走在前列”要求具有重要意义。

三、      系统特点

一是检索结果便于引用:检索结果以PDF呈现与纸质出版物一致页面,可直观知晓资料的卷册名称、页码等信息,便于研究人员引用。

二是检索逻辑符合史志特色:系统具有人物、地名、纪年等具有方志特色的词库,检索结果便于贴近用户意图。例如关键词“乾隆元年”,系统可对应到1736-1796年。

三是关键词智能推荐:系统可依据当前关键词,向用户推荐贴近用户意图的相关术语、词组,扩大用户的知识视野,具有“善解人意”的能力。

 


打印本页】 【关闭窗口】 【收藏本页