【使用方法】
访问网站www.inindex.com,即可通过简体、繁体或拼音进行检索。同时,也可通过综合查询功能对数据库内容进行查找。引得数字人文资源平台还拥有丰富的古文献原文阅读资源,并以原文图片+文本对照形式展示。此外,用户可通过引得平台的工具集功能来制作多种可视化图谱,以支持用户的学习及学术研究。
试用期至2021年12月17日
引得数字人文源平台(中国历代人物传记资料库CBDB)是由哈佛大学费正清中国研究中心、台湾“中央研究院”历史语言研究所、北京大学中国古代研究中心及中文在线四方共同合作打造的记录中国古典数据的数字人文资源平台。CBDB系线上关系型数据库,整合中国历史上所有重要的传记数据。“引得”内容由人物、亲属、非亲属关系、社会区分、入仕途径、官历、地址、著述、研究成果等部分组成。截至目前,数据库基于150余位专家学者的学术研究积累,平台共收录从先秦到清末约49万历史人物的传记、著作资料,总量超过4亿字。所收录的人物主要出自七世纪至十九世纪,其中以唐、宋、明、清的人物传记资料最为充实。该数据库除了可作为人物传记的参考资料外,也是数字人文领域从古老、传统的研究,走向新时代的一个重要路径。
【数据库组成】
引得数字人文平台包含“两库、两工具”。
1.传记查询:中国历代人物传记资料库(CBDB)
CBDB是全球较早进行数据结构化的大型中国历代人物关系传记数据库,目前收录从先秦到晚清约49万人的传记、著作资料(约4亿字,存储信息量达2TB),每年新增4万条传主和100万条信息。所收录的人物主要出自七世纪至十九世纪,其中以唐、宋、明、清的人物传记资料最为充实。该数据除了可以作为人物研究的参考资料之外,CBDB亦可提供可视化查询服务,进行统计分析,大数据挖掘,用于群体传记研究、地理空间分析、社会交往网络分析等。检索结果还可灵活地导入其他软件进行分析使用。
2.通用文献:中国通用古籍文库
中国通用古籍文库与CBDB互通,可在线实时全文检索的大型古籍资源库数据,收录中国公私机构现存从先秦至民国撰写并经写抄本、刻本、印本、影印的历代汉文古籍资源约2万种31亿文字。该数据库可以做到字字可检索,可按照部、属、书名、著者、高级检索等功能。
3. 人文工具:数字人文文本处理基础工具
为学者提供文本识别、批量标注、简繁转换、自动句读、命名实体、文本比对的全流程、一站式文本处理工具箱服务,大幅提高文献数字化、结构化效率。截至目前,古籍在线OCR工具对竖排古籍识别正确率接近92%,横排简体识别正确率接近98%。
4. 元引图表:数据可视化挖掘工具
现拥有100余种可视化图表,利用知识图表工具、大数据和相关概念构建可视化图表,无需编程,轻松制图,助力学者视野更宽更广,发现研究新方向。
【数据库特点】
◆中文在线引得数字人文资源平台(中国历代人物传记资料库CBDB)的内容由人物(People)、亲属(Kinship)、非亲属关系(Non-kinship Associations)、社会区分(Status)、入仕途径(Modes of Entry into Government)、官历(Offices / Postings)、地址(Places)、著述(Writings)、研究成果(Research result)等部分组成。平台通过整合分析古代传记、著作等古籍资源,进而得到历史人物的生平、社会区分、人际关系、迁徙历程、为官履历等相关信息。
◆引得数字人文资源平台(中国历代人物传记资料库CBDB)资料的来源包括传记资料(宋人传记资料、元人传记资料、明人传记资料、清代人物生卒年表)、史料(正史列传、墓志铭、墓表、地方志列传)、文学作品(文集之祭文、序、记、书信等)、官方文书(郡守年表、会要、官禄等)。用户可对古籍文献进行下载阅览。
◆尊重历史以及古籍原貌,采用繁体字原文+简体字注释+中英文标注多种形式充分展示历史数据,显示包括人物的中英文生平介绍、资料出处、别名、地址、入仕、任官、社会区分、亲属关系、社会关系、著述等信息,还可以关联查找古籍出处、原文,真正将古籍与历史、人物生动串联,重构古文献研究服务新脉络。
◆能根据姓名、地名、官名、年代、朝代以及籍贯等不同的检索条件查找相应的传记资料。检索条件可以是简单的条件,也可以通过复杂的组合条件进行筛选,用户可以在线访问数据库进行检索。
◆支持数据可视化分析,可以从网站上下载相关的分析数据表格和图表应用于其它工具库中,将数据录入数据模版并上传以制作历史人物相关的地理信息分析图与人物关系图谱。同时支持网页端以及移动端操作。
◆遵循数据采集-存储-加工-更新-复用循环反复的古籍内容整理流程,运用人工智能技术,提高处理历史资料的效率和准确度。