一、采购内容:
本项目为“十四五”时期,文化和旅游部为进一步加强公共数字文化建设,提升全民阅读数字化服务水平,面向公共图书馆系统组织实施的。
项目内容 | 数量 |
《寻觅铁岭-革命历史文化遗址遗迹》主题微视频拍摄及制作 | 15集 |
知识资源细颗粒度建设和标签标引 | 10000条 |
二、项目简要技术要求
1、《寻觅铁岭-革命历史文化遗址遗迹》主题微视频拍摄及制作项目
1.1、供应商按照《国家图书馆关于公共数字文化工程 2019 年度数字资源联合建设著录规则》中《特色馆藏专题资源建设项目加工及著录规则(2019)》(见附录),制作对象数据,每个视频时长5分钟左右,共15个视频。制作完成的数据应由人工进行审校,以保证数据质量。
1.2数据提交成果包括超高清 4K(16:9 格式,3840×2160 像素))标准对象数据、元数据、版权证明、其他说明文件以及第三方数据质检报告等。原始拍摄素材、拍摄思路、分集梗概、脚本撰写、 采访录制、解说配音、配乐、后期制作、剪辑包装等全部项目数据,参与制作人员及单位名单,文字稿本(分镜头本、完成稿本),工程文件(过程性编辑文件)及成片,也须全部交付采购人可以正常使用标准的光盘 3 套。
1.3拍摄的原始素材时长至少为成片的 10 倍以上,成片有统一的包装设计。
1.4项目建设过程中涉及第三方版权问题的,供应商须取得相应的书面授权书,保证视频资料的著作权及相应知识产权全部归采购人所有,保证项目建设内容不侵犯第三人的合法权益(包括但不限于著作权等知识产权)。任何第三方提出侵权请求的,供应商须与第三方交涉并承担由此发生的一切责任、费用和经济赔偿。
1.5视频完成后的成品、素材等所有文图、音视频资料的著作权及相应的知识产权全部归采购人所有,与供应商无关。供应商均不得擅自传播或二次出售,项目验收通过后即刻删除项目所有相关数据。
1.6项目拍摄应采用 2 机位进行拍摄,所采用摄像机成像系统要求为 2/3 英寸EMXOR 或 3COMS 模式,摄像机支持 4(K 16:9格式,3840×2160 像素)超高清拍摄。采访收音根据实际拍摄情况使用超指向话筒或无线胸麦。
1.7质量要求:
1.7.1微视频中的字幕文件要由采购人审核认可后方可制作。
1.7.2微视频的字幕清晰,无错别字,字幕规范。
1.7.3片头片尾需根据采购人要求进行编辑涉及。
1.7.4根据情节需要,剪辑配置背景音乐。
1.7.5微视频须进行配音,配音人员要求为男性,音色符合建设主题,须具有普通话甲级证书。
1.7.6成片记录段落内禁止出现彩条和其他杂乱信号。
1.7.7成片中不能带营利性广告内容。
1.7.8数据制作前须制定详细的总体拍摄方案和文字脚本,方案需采购人同意。文字脚本需经铁岭市图书馆论证通过,各集的内容能够串联起来,无科学性、原则性、常识性错误。
2、 知识资源细颗粒度建设和标签标引项目
2.1、项目建设内容基于铁岭市图书馆馆藏的地方图书,进行全文数字化加工后,对内容进行细粒度标引,实现主题词、关键词级的标引建设。
2.2、在资源精细化标引的基础上,对资源进行重新聚类,形成主题化、专题化的分类揭示,从而实现智能化知识发现。
2.3、利用语义网、知识图谱、大数据、智能计算等技术,开展对基础数字资源的细颗粒度内容标识、关键知识点的标签和标引建设,实现资源的精细化揭示和知识化、专题化服务。
2.4、数据加工过程中应综合分析加工对象的文献形态、内容结构与服务需求,确定知识资源加工粒度,根据文献实际情况,科学合理确定著录与标引内容。
2.5、供应商需搭建支持数据检索、数据计算及数据分析等知识服务调用,实现知识导航、语义检索、智能推荐等智慧化服务,并形成可视化立体知识呈现的数据发布展示平台,将本项目建设成果与上一年度同类项目建设成果合并进行整合发布应用。
2.6、项目数据成果提交内容包括元数据、对象数据、证明文件和数据说明文件。
2.7、项目建设过程中接触的所有资源以及制作完成的所有项目资源,供应商均不得擅自传播或二次出售,项目验收通过后即刻删除项目所有相关数据。
2.8、项目建设应充分考虑兼容性与可扩展性,供应商应对铁岭市图书馆未来同类型数字资源整合、仓储及应用提供售后支持。
2.9、项目建设标准按照2021年9月国家图书馆制定的《智慧图书馆知识资源数据建设指南》(最终版)执行。
三、服务期及服务要求
1. 服务期:自合同签订之日起90天内完成项目建设及数据提交。
2. 服务要求:供应商确定专人负责与釆购人对接协调工作;在项目建设过程中,供应商需及时汇报工作情况,随时接受釆购人的监督与考察;在项目建设过程中,供应商必须根据项目要求、实际状况,结合釆购人意见,及时调整建设方案。
四、付款条件及付款方式
供应商完成项目全部建设任务并向采购人提交数据,经采购人书面验收合格后,一次性向供应商支付全部项目款项。(具体以签订合同为准)
五、其他要求
1、视频制作过程中产生的外景拍摄交通、食宿、专家咨询等费用均由供应商承担。
六、附录1:特色馆藏专题资源建设项目加工及著录规则(2019)
一、元数据规则
(一)著录对象
著录对象为全国各公共图书馆自建的各种类型的专题数字资源。
(二)著录粒度
一般以具有独立名称或独立标识的一个信息资源为著录单位,如一种图书、一本期刊、一组或一幅图像、一个网页等,以及会议论文集或期刊中的一篇论文、一张光盘中的一个曲目等。
对于多部分资源,一般可自由选择综合著录或分散著录。
(三)术语集说明
术语 | 必备性 | 著录内容 |
记录标识号 | 必备 | 分配给本条元数据的标识符号,命名规则见“三、命名规则”。 |
名称 | 必备 | 赋予资源的名称,一般指资源的正题名信息。在资源本身没有名称的情况下,可由编目员自拟,不能使用“图1”、“讲座1”等无意义的名称作为正题名。 |
其他题名 | 有则必备 | 任何可替代正式题名的其他名称。 |
创建者 | 有则必备 | 创建资源内容的主要责任者,包括个人、组织或某项服务,通常用创建者名称标识。 |
责任方式 | 有则必备 | 创建者与资源之间的责任关系。 |
其他责任者 | 有则必备 | 对资源内容做出贡献的其他实体。包括个人、组织或某项服务,通常用责任者名称标识。 |
责任方式 | 有则必备 | 责任者与资源之间的责任关系。 |
主题词或关键词 | 必备 | 描述资源内容的受控或非受控的词汇。受控主题应依据《中国分类主题词表》进行标引。 |
分类 | 必备 | 描述资源内容的分类号。古籍类资源应根据《四部分类法》进行标引,非古籍类资源应根据《中国图书馆分类法》(第五版)进行标引。 |
摘要 | 必备 | 资源的内容摘要。在50-150字之间为宜。 |
目录 | 有则必备 | 著录资源组成部分的名称。 |
附注 | 有则必备 | 关于资源内容的其他说明。应前置导语,说明所著录内容的语义。 |
出版者 | 有则必备 | 使资源可以获得和利用的责任实体,通常用出版者名称标识。包括出版者或颁布者。 |
出版地 | 有则必备 | 出版者的所在地,一般著录到城市。 |
出版日期 | 有则必备 | 资源出版或颁布的日期。对派生数字资源著录实体文献的出版日期。 |
创建日期 | 有则必备 | 原生数字资源的创建日期。 |
内容形式 | 以某一数字资源实体为著录对象时必备 | 著录资源的内容形式词及内容限定词,根据国标《信息资源的内容形式和媒体类型标识》(GB/T 3469-2013)进行著录。 |
媒体类型 | 以某一数字资源实体为著录对象时必备 | 著录资源的媒体类型,根据国标《信息资源的内容形式和媒体类型标识》(GB/T 3469-2013)进行著录。 |
格式 | 以某一数字资源实体为著录对象时必备 | 资源的格式。取值包括但不限于TIF、JPG、PDF、MPG、WMV、FLV等。 |
大小 | 以某一数字资源实体为著录对象时必备 | 资源的大小或持续时间。 |
技术细节 | 有则必备 | 用于描述与资源格式相关的技术环境细节。除软硬件需求外,图像类资源应著录颜色、分辨率;视频类资源应著录颜色、分辨率、是否有声;音频类资源应著录比特率。应前置导语,说明所著录内容的语义。 |
标识符(CDOI) | 以某一数字资源实体为著录对象时必备 | 著录在CDOI中确认资源的唯一标识。 |
发布地址 | 必备 | 著录资源在资源提交馆的发布地址。 |
语种 | 有则必备 | 著录资源的正文或声道语种。有语言文字的资源语种为必备。应根据《新版中国机读目录格式使用手册》(附录A)进行著录。 |
关联 | 有则必备 | 对相关资源的参照。描述包括参照、包含、继承、替代、版本、格式等关系。 |
所属专题 | 有则必备 | 著录资源所属的专题。以整个专题为著录对象时不著录本字段。 |
权限 | 必备 | 有关资源本身所有的或被赋予的权限信息。著录内容包括但不限于信息网络传播权-互联网、信息网络传播权-局域网、信息网络传播权-数字电视、信息网络传播权-移动终端、长期保存权、数字化形式复制权、转授权、单机等非网络形式、其他。 |
访问权限 | 必备 | 关于谁能访问资源的信息,或者是对资源密级状态的说明。著录资源授权使用的用户,包括但不限于互联网匿名用户、互联网实名用户、国图读者卡用户、局域网用户、其他。 |
数据提交单位 | 必备 | 描述提交该资源的单位。 |
所属任务年份 | 必备 | 联建工作的任务年度, 本年度数据著录为2019。 |
其他字段 | 有则必备 | 著录任何无法著录进已有的著录项外的任何需要描述的内容。应加前置导语,说明著录内容的含义。 |
(四)著录说明
1.著录标识符
本标准中应用到的著录标识符包括两部分:一是为标识语义使用,推荐采用ISBD著录标识符。二是项目统一要求,当重复著录内容时,使用半角分号作为分隔符。
2.规范文档
术语 | 规范文档 |
分类 | 中国图书馆分类法(第五版)、中华古籍总目分类表 |
主题词 | 中国分类主题词表 |
**日期 | W3CDTF |
内容形式 | 信息资源的内容形式和媒体类型标识(GB/T 3469-2013) |
媒体类型 | 信息资源的内容形式和媒体类型标识(GB/T 3469-2013) |
语种 | 新版中国机读目录格式使用手册(附录A) |
3.其他
Ø 格式:著录需用英文大写字母。
Ø 大小:著录文件大小的单位统一使用大写英文字母著录;时长著录格式为:“HH:MM:SS”;著录对象由若干个文件组成时,应描述该资源所有文件总的大小。
Ø 技术细节:颜色分为单色、黑白、彩色、灰度、混合等几种类型;分辨率著录格式为:横向像素×纵向像素;声音取值一般为有声、无声;比特率取值单位一般为bit/s、Kbit/s、Mbit/s。
二、数字对象标准
专题所建数字对象分为长期保存级和发布服务级两种级别。
(一) 图像类
资源级别 | 分辨率(dpi) | 色彩位深 | 文件格式 |
长期保存级 | >=300 数码照片:不小于300万像素 | 黑白: 8位,24位; 彩色:24位 | TIFF |
发布服务级 | 300 数码照片:不小于300万像素 | JPEG PDF |
(二)音频类
资源级别 | 主要参数 | 文件格式 |
采样率(KHz) | 量化级(bit) | 通道数 |
长期保存级 | 128 | 24 | 由原始资料特性决定 | WAV |
发布服务级 | 44 | 16 | 双声道/单声道 | MP3 |
(三)视频类
资源级别 | 主要参数 |
分辨率 | 帧数(帧/秒) | 视频码率(Mbps) | 视频画幅宽高比 | 音频速率(Kbps) | 音频采样率(KHz) | 编码 | 文件格式 |
长期保存级(高清) | 1920×1080 | 25 | 固定码率25Mbps | 16:9 | 384 | 48 | MPEG-2编码 | MPG、M2P、AVI |
长期保存级(标清) | 720×576 | 25 | 固定码率7.5Mbps | 4:3 | 384 | 48 |
发布服务级(高清) | 1280×720 | 25 | 固定码率不低于1.5Mbps | 16:9 | 320 | 48 | H.264编码 | MP4 |
发布服务级(标清) | 720×576 | 25 | 4:3 | 320 | 48 |
(四)数字化质量要求
1. 扫描前根据国际色彩协会ICC标准,做基本的色彩校正,及针对各类型图书进行色彩校正。
2. 对扫描中出现的偏斜、黑点、黑线、黑框、黑边等进行去污纠偏处理。
3. 同一资源相同扫描方式生成的图像应保持相同的清晰度,尺寸相同。
4. 数字化后的图像清晰,不得有失真现象。
5. 保存级数字对象应保持文献原貌,尽量不对图像文件进行后期处理。
三、命名规则
(一)记录标识号
记录标识号用于标识元数据,是元数据永久唯一的标识符号。
记录标识号共15位,由4段组成:机构代码—专题代码—任务年—流水号。其中:
Ø 机构代码:4位。(见图书馆机构代码表)
Ø 专题代码:2位,由国家图书馆统一分配。(见《特色馆藏专题资源建设项目专题代码(2019)》)
Ø 任务年:4位。
Ø 流水号:5位,本批内数据顺序号,从00001起顺序排列。
记录标识号各段之间不加任何连接符。
(二)文件结构
1.元数据文件结构
元数据文件名由3段组成共10位:机构代码—专题代码—年月,各段的意义详见记录标识号。
元数据文件存储路径为:根目录\文件夹名\
元数据文件夹命名与元数据文件命名规则一致。
2.数字对象文件结构
数字对象存储路径为:根目录\记录标识号\加工级别\
其中第二级目录为加工级别,加工级别有两种:长期保存级和发布服务级。
数字对象文件结构示意图如下:
├─记录标识号1
│ ├──长期保存级
│ │ ├─文件1
│ │ ├─文件2
│ │ └─……
│ └──发布服务级
│ │ ├─文件1
│ │ ├─文件2
│ │ └─……
├─记录标识号2
│ ├──长期保存级
│ └──发布服务级
└─记录标识号……
数字对象文件名由3段组成,共19位:记录标识号—加工级别—流水号。记录标识号15位;加工级别1位,长期保存级使用小写字母a标识,发布服务级使用小写字母b标识;流水号3位,相同记录标识号不同加工级别的数字对象分别从001开始。不同数字对象的文件名不能重复。
3.证明文件文件夹结构
文件夹内包含:版权证明电子版、第三方质检报告电子版。电子版扫描时应采用300DPI,采用PDF格式保存。
文件夹名称为:证明文件。存储路径为:根目录\文件夹名\
版权证明文件的命名方式为“机构名称+版权证明+提交年月+下划线+2位流水号”, 第三方质检报告文件的命名方式为“机构名称+第三方质检报告+提交年月”。
(三)数据提交说明表要求
数据提交说明表包括总体说明表和明细说明表。当同时提交多个专题资源时,应分别放在不同的明细说明表进行说明。总体说明表和明细说明表存放在一个EXCEL文件的多个工作表中,EXCEL文件的命名方式为“机构名称+数据提交说明表+提交年月”,存放在提交介质的根目录下。
例:某图书馆2016年12月提交的数据提交说明表的存储路径为:
根目录\某图书馆数据提交说明表201612
1.总体说明表
总体说明表 |
提交日期 | |
制作单位 | |
质检单位 | |
介质 | 类型(编号) | |
数量 | |
记录标识起止号 | |
内 容 | 专题名称 | 元数据数量 | 数字对象数量 | 存储量(MB) |
| | | |
| | | |
备注 | |
说明:
Ø “记录标识起止号”一栏,填写提交数据起止的两个记录标识号,如中间有空号,需做出说明;
Ø “专题名称”一栏,填写专题正式名称,不同专题应分别填写;
Ø “元数据数量”一栏,填写本批提交某一专题的元数据的总条数;
Ø “数字对象数量”一栏,填写本批提交某一专题的数字对象的总个数;
Ø “存储量”一栏,填写本批提交某一专题的数字对象的总存储量。
2.明细说明表
明细说明表 |
专题名称:制作单位:提交日期: |
序号 | 记录标识号 | 题名 | 数字对象长期保存级 | 数字对象发布服务级 | 备注 |
文件格式 | 文件数量 | 存储量(MB) | 文件格式 | 文件数量 | 存储量(MB) |
1 | | | | | | | | | |
2 | | | | | | | | | |
.. | | | | | | | | | |
总计 | | | | | | | | | |
说明:
Ø “记录标识号”一栏,填写资源的记录标识号,应与元数据中“记录标识号”项保持一致;
Ø “题名”一栏,填写资源的名称,应与元数据中“名称”项保持一致;
Ø “文件格式”一栏,填写资源包含数字对象的格式,如TIFF、PDF等;当格式不唯一时,应根据不同格式分别填写文件数量、存储量;
Ø “文件数量”一栏,以个为单位分格式填写数字对象的数量;
Ø “存储量(MB)”一栏,以MB为单位分格式填写数字对象的实际存储量。
四、修订说明
1.本年度新增第三方质检报告及版权证明电子版的提交工作,具体修订见三(二)3.证明文件文件夹结构。
2.本规则对记录标识号的命名规则进行了修改。
附件1
信息资源的内容形式和媒体类型标识简表
n 内容形式词
内容形式词 | 词的定义和范围 |
数据集 | 由数字编码数据表示的、要用计算机处理的内容。不包括数字形式记录的音乐、语言、声音、计算机复制的图像和文本。 |
图像 | 通过线条、形状、阴影等表示的、用视觉感知的内容。图像可以是静态的或动态的,二维的或三维的。 |
运动 | 通过动作,即物体或人改变位置的动作或过程所表示的内容。但不包括动态图像。 |
音乐 | 通过连续地、组合和时序关系传送有序音调或声音,产生乐曲而表示的内容。音乐可以是手写的(乐谱)、演奏的、以模拟或数字形式录制的(有节奏、旋律或和声的歌唱声、乐器声和机械声)。 |
实物 | 通过三维材料(自然实体或人造/机造人工制品)表示的内容。也称为三维结构或教具。 |
程序 | 通过用计算机处理或执行的数字编码指令表示的内容。 |
声音 | 通过动物、鸟类、自然噪声源,或人类声音、数字(或模拟)媒体模拟的声音而表示的内容。但不包括录制的音乐、话语录音。 |
话语 | 通过人类说话声音表示的内容。 |
文本 | 通过书写词语、符号和数字表示的内容。 |
多种内容形式 | 含三种或三种以上形式的混合内容。 |
其他内容形式 | 如果上列词语都不适用于受编资源,则使用“其他内容形式”。 |
内容限定
Ø 类型说明
测绘型 | 以任何比例表示地球或任何天体整体或部分的内容。 |
记谱型 | 为艺术目的(例如,音乐、舞蹈、舞台演出)通过符号系统以视觉感知表示的内容。 |
表演型 | 在一定时间、在资源上记录、以听觉形式或视觉形式表示的内容。 |
Ø 运动说明
动态 | 通常通过快速的连续图像,感知动态的图像内容。 |
静态 | 感知静态的图像内容。 |
注:感知资源图像内容中有无运动,内容形式为“图像”时使用。 |
Ø 维数说明
二维 | 以二维形式感知的图像内容。 |
三维 | 以三维形式感知的图像内容。 |
注:感知资源图像内容的空间维数。若从内容形式无法推断这类内容限定时,应该使用上表所列词,内容形式为“图像”时使用。 |
Ø 感官说明
听觉 | 通过听觉感知的内容。 |
味觉 | 通过味觉感知的内容。 |
嗅觉 | 通过嗅觉感知的内容。 |
触觉 | 通过触觉感知的内容。 |
视觉 | 通过视觉感知的内容。 |
注:这个属性是指感知内容的人类感官。若从内容形式无法推断这类内容限定时,应该使用上表所列词。 |
n
媒体类型词
媒体类型词 | 适用的载体类型 |
音频 | 可用音频播放器播放的资源。 |
电子 | 计算机可用的资源。 |
缩微 | 可以使用缩微品阅读器的资源。 |
显微 | 使用显微镜的资源。 |
投影 | 使用投影仪的资源。 |
立体 | 可以使用立体观察器的资源。 |
视频 | 可以使用视频播放器的资源。 |
多媒体 | 用于三种或三种以上媒体类型适用的混合载体资源。 |
其他媒体 | 如果上列的词不适用于媒体类型和观看、使用或感知被著录资源内容需要的中介设备,则著录“其他媒体”这个词。 |
七、附录2 知识资源细颗粒度建设和标签标引加工及著录规则
记录标识号是资源加工过程中精细化标引数据(包括基础文献、细粒度加工数据、知识抽取数据)、知识组织与专题服务数据、新型数字资源的唯一标识,每条数据赋予一个记录标识号。
记录标识号共 18 位数字,由 4 段组成:机构代码-资源类型-项目建设年-流水号,记录标识号各段之间不加任何连接符。其中:
l 机构代码:4 位。同数字图书馆推广工程联合建设项目图书馆机构代码。
l 资源类型代码:3 位。各类型资源代码见表1。
l 项目建设年:4 位。
l 流水号:7 位。每条数据赋予一个流水号,从0000001 起顺序排列,细粒度加工数据的流水号应按照标引对象在基础文献中的先后顺序进行排列。
表1资源类型代码表
资源类型 | 代码 |
精细化标引数据 | 基础文献 | 图书 | 100 |
期刊 | 110 |
报纸 | 120 |
古籍 | 130 |
音频 | 150 |
视频 | 160 |
细粒度加工数据 | 析出资源 (包括封面、目录、篇章以及音视频中析出的小节等,不包括图表和音视频资源的责任者) | 200 |
图表 | 210 |
音视频责任者 | 220 |
知识抽取数据 | 人物 | 300 |
机构 | 310 |
事件 | 320 |
地理名称 | 330 |
专题 | 340 |
作品 | 350 |
实物 | 360 |
| | 知识内容片段 | 370 |
附件2 基础资源著录字段要求
表2基础资源著录内容
序号 | 中文名称 | 字段名称 | 字符类型 | 必备性 | 对应书目数据MARC内容 |
1 | 001 | record_id | char | 有则必备 | MARC数据中的001字段 |
2 | 加工编号 | book_id | char | 必备 | 加工编号 |
3 | 题名 | book_name | char | 必备 | MARC数据中的200$a |
4 | 出版地点 | pub_place | char | 有则必备 | MARC数据中的210$a |
5 | 出版者 | pub_house | char | 有则必备 | MARC数据中的210$c |
6 | 出版时间 | pub_date | char | 有则必备 | MARC数据中的210$d |
7 | 出版周期 | pub_T | char | 有则必备 | MARC数据中的326$a $b(著录形式为a(b);326字段若重复,用空格隔开) |
8 | 起止卷期 | start_end_day | 备注 | 有则必备 | MARC数据中的207$a(用空格分隔$a重复字段) |
9 | 更名信息 | name_change | char | 有则必备 | MARC数据中的311$a |
10 | 附注信息(号外、增刊等) | general_notes | char | 有则必备 | MARC数据中的300$a |
11 | 特殊附注(出版规律) | specific_notes | 备注 | 有则必备 | MARC数据中的315$a |
12 | 总卷期 | pub_num | char | 有则必备 | MARC数据中的215$a |
13 | 主题词 | topic_word | char | 有则必备 | MARC数据中的610$a |
附件3细粒度文献著录字段要求
表3报纸细粒度著录内容
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指细粒度加工数据的记录标识号,是数据的唯一标识符,具体见附件1。 |
基础文献记录标识号 | sourceID | 必备,不可重复 | 指析出著录对象的基础文献的记录标识号,字段值取自基础文献元数据identifier 字段,具体见附件2。 |
出版日期 | issuedDate | 必备,不可重复 | 著录对象基础文献的出版日期,格式为 YYYY-MM-DD |
起始页文件名 | startFileName | 必备,不可重复 | 对象数据文件名 |
结束页文件名 | endFileName | 必备,不可重复 | 对象数据文件名。如果著录对象只有1页,则结束文件名同起始文件名。 |
对象文件路径 | filePath | 必备,不可重复 | 对象数据文件存储的相对路径 |
结构类型 | type | 必备,不可重复 | 如:正文、广告等 |
语种 | language | 必备,可重复 | 著录对象文字语种 |
正题名 | title | 必备,可重复 | 著录对象的主要题名,原报该部分无标题则著录时可自拟标题 |
并列正题名 | parallelTitle Proper | 有则必备,可重复 | 正题名的另外一种语言和/或文字的题名 |
其他题名 | otherVariantT itle | 有则必备,可重复 | 从属于正题名或并列题名的副题名或其他题名说明文字 |
栏目名称 | column | 有则必备,不可重复 | 著录对象从属的栏目 |
责任者 | contributor | 有则必备,可重复 刊 | 对著录对象负有主要责任的责任者名称,个人名称或通讯社团体名称 |
责任方式 | role | 有则必备,可重复 | 责任者的责任方式,如著 |
责任者单位 | institution | 有则必备,可重复 | 责任者工作单位 |
内容 | content | 有则必备,可重复 | 著录对象的全文文本内容为非结构式的,全部文字录入同一字段。内容为结构式时,则录入子章节的内容,重复本字段。 |
附注 | notes | 有则必备,可重复 | 著录对象位于文末或脚注信息,如摘自或引自或原载于等 |
版次 | spacenum | 有则必备,可重复 | 著录对象所在页的版次信息,包转版。仅对正文篇章著录 |
摘要 | abstract | 必备,可重复 | 仅对正文篇章著录,著录内容为篇章提要或文摘 |
分类号 | classificatio n | 必备,可重复 | 《中国图书馆分类法》分类号。仅对正文篇章著录 |
关键词 | keyword | 必备,可重复 | 仅对正文篇章著录,著录内容为反映著录对象内容、主题或时空范围的词语 |
人物名称 | personalName | 有则必备,可重复 | 著录对象所含的人物名称。属于本项目知识抽取数据的人物,在人物名称后将人物数据的记录标识号著录在[ ]中 |
机构名称 | organizationN ame | 有则必备,可重复 | 著录对象所含的机构名称。属于本项目知识抽取数据的机构,在机构名称后将机构数据的记录标识号著录在[ ]中 |
地理名称 | geographicalN ame | 有则必备,可重复 | 著录对象所含的地理名称。属于本项目知识抽取数据的地理名称,在地理名称后将地理数据的记录标识号著录在[ ]中 |
事件名称 | eventName | 有则必备,可重复 | 著录对象所含的事件名称。属于本项目知识抽取数据的事件,在事件名称后将事件数据的记录标识号著录在[ ]中 |
图表记录标识号 | tableID | 有则必备,可重复 | 指著录对象所含图表的记录标识号,字段值取自图表元数据 identifier 字段,具体见附件。 |
图表数量 | tableNumber | 有则必备,不可重 复 | 本加工项目中著录的图表数量 |
表4图表细粒度著录内容
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指细粒度加工数据的记录标识号,是数据的唯一标识符,具体见附件1。 |
基础文献记录标识号 | sourceID | 必备,不可重复 | 指析出图表的基础文献的记录标识号,字段值取自基础文献元数据identifier 字段,具体见附件2。 |
起始页文件名 | startFileName | 必备,不可重复 | 对象数据文件名 |
结束页文件名 | endFileName | 必备,不可重复 | 对象数据文件名,如果图表只有 1 页, 则结束文件名同起始文件名。 |
对象文件路径 | filePath | 必备,不可重复 | 图表对象数据文件存储的相对路径 |
图表类型 | type | 必备,不可重复 | 用词语标识图表类型 通用图表类型包括:插图、地图、照 片、示意图、统计表、乐谱、谱系表、工程图等。 古籍图表类型包括:插图、肖像、地图、景物图、器物图、谱系表、航海 图、工程图、故事图、山石鸟兽图、神怪图、宗教图、乐谱等。 |
语种 | language | 必备,可重复 | 图表文字的语种 |
正题名 | title | 必备,可重复 | 图表的主要标题,如无标题则自拟 |
并列正题名 | parallelTitle Proper | 有则必备,可重复 | 图表正题名的另外一种语言和/或文字的题名 |
其他题名 | otherVariantT itle | 有则必备,可重复 | 从属于正题名或并列题名的副标题或其他题名说明文字 |
责任者 | contributor | 有则必备,可重复 | 图表的主要创建者名称 |
责任方式 | role | 有则必备,可重复 | 图表主要创建者的责任方式 |
创作时间 | originDate | 有则必备,可重复 | 图表的撰写时间 |
创作地点 | originPlace | 有则必备,可重复 | 图表的创作地点 |
内容 | content | 有则必备,可重复 | 图表的非结构化全文文本 内容为表格的,录入全部文字内容为图片时,录入图片中有内容含义的文字 |
附注 | notes | 有则必备,可重复 | 位于图表文末或脚注信息,如摘自或引自或原载于 |
页数 | fileNumber | 必备,不可重复 | 图表页数 |
分类号 | classificatio n | 必备,可重复 | 《中国图书馆分类法》分类号 |
关键词 | keyword | 必备,可重复 | 仅对正文篇章著录,著录内容为反映著录对象内容、主题或时空范围的词语 |
人物名称 | personalName | 有则必备,可重复 | 著录对象所含的人物名称。属于本项目知识抽取数据的人物,在人物名称后将人物数据的记录标识号著录在[ ]中 |
机构名称 | organizationN ame | 有则必备,可重复 | 著录对象所含的机构名称。属于本项目知识抽取数据的机构,在机构名称后将机构数据的记录标识号著录在[ ]中 |
地理名称 | geographicalN ame | 有则必备,可重复 | 著录对象所含的地理名称。属于本项目知识抽取数据的地理名称,在地理名称后将地理数据的记录标识号著录在[ ]中 |
事件名称 | eventName | 有则必备,可重复 | 著录对象所含的事件名称。属于本项目知识抽取数据的事件,在事件名称后将事件数据的记录标识号著录在[ ]中 |
附件4知识内容抽取字段要求
表5 人物知识内容标引
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指知识抽取数据的记录标识号,是数据的唯一标识符,具体见附件1。 |
基础文献记录标识号 | sourceID | 必备,可重复 | 指本条数据的信息基础,字段值取自基础文献元数据 dentifier 字段,具体见附件2。 |
人物通用名称 | personalName | 必备,不可重复 | |
人物异名 | variantPerso nalName | 有则必备,可重复 | 别名、字号、笔名等。 |
性别 | gender | 有则必备,不可重复 | |
时代 | period | 有则必备,不可重复 | |
出生年 | birthDate | 有则必备,可重复 | 公元纪年 |
卒年 | deathDate | 有则必备,可重复 | 公元纪年 |
国别 | nationality | 有则必备,可重复 | |
籍贯 | nativePlace | 有则必备,可重复 | |
民族 | ethnicGroup | 有则必备,不可重复 | |
亲属关系类别 | kinship | 有则必备,可重复 | |
亲属关系人物 | kinshipPerso n | 有则必备,可重复 | 人名。属于本项目标引条目的人物,可在人物名称后将人物数据的记录标识号著录在[ ]中 |
非亲属关系类别 | nonKinship | 有则必备,可重复 | 人名。属于本项目标引条目的人物,可在人物名称后将人物数据的记录标识号著录在[ ]中 |
非亲属关系人物 | nonKinshipPe rson | 有则必备,可重复 | |
传略 | biography | 必备,不可重复 | 可直接摘录原文 |
任职机构 | institution | 有则必备,可重复 | |
职务名称 | position | 有则必备,可重复 | |
任职时间段 | employTime | 有则必备,可重复 | |
著述 | writings | 有则必备,可重复 | 著述名称、时间、出版信息等 |
附注 | notes | 有则必备,可重复 | |
表6 机构知识内容标引
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指知识抽取数据的记录标识号, 是数据的唯一标识符,具体见附件1 |
基础文献记录标识号 | sourceID | 必备,可重复 | 指本条数据的信息基础,字段值取自基础文献元数据identifier 字段,具体见附件2 |
机构中文全称 | chiOrganizatio nName | 必备,不可重复 | |
机构英文全称 | engOrganizatio nName | 有则必备,不可重复 | |
机构简称 | abbreviatedOrg anizationName | 有则必备,可重复 | 包括机构别称 |
地址 | address | 有则必备,可重复 | |
前置机构 | previousOrgani zation | 有则必备,可重复 | |
后置机构 | nextOrganizati on | 有则必备,可重复 | |
存续起始时间 | startTime | 有则必备,可重复 | |
存续结束时间 | endTime | 有则必备,可重复 | |
行业类型 | type | 必备,可重复 | |
机构描述 | description | 必备,可重复 | 可直接摘录原文 |
重要人物名称 | personalName | 有则必备,可重复 | 通用名称或规范名称。属于本项目知识抽取数据条目的人物,可在人物名称后将人物数据的记录标识号著录在[ ]中 |
重要人物事迹 | personalDescri ption | 有则必备,可重复 | 可直接摘录原文 |
重要事件 | event | 有则必备,可重复 | 可直接摘录原文。属于本项目知识抽取数据条目的事件,可在机构名称后将事件数据的记录标识号著录在[ ]中 |
重要成果 | achievement | 有则必备,可重复 | 著述成果以及文艺作品、建筑作品等各类型作品 |
表7 事件知识内容标引
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指知识抽取数据的记录标识号,是数据的唯一标识符,具体见附件1。 |
基础文献记录标识号 | sourceID | 必备,可重复 | 指本条数据的信息来源,字段值取自基础文献元数据identifier 字段,具体见附件2 |
事件中文全称 | chiEventName | 必备,不可重复 | |
事件英文全称 | engEventName | 有则必备,不可重复 | |
事件简称 | abbreviatedEve ntName | 有则必备,可重复 | |
事件起始时间 | startTime | 有则必备,可重复 | |
事件结束时间 | endTime | 有则必备,可重复 | |
地点 | place | 有则必备,可重复 | |
事件类型 | type | 必备,可重复 | |
事件描述 | description | 必备,可重复 | 可直接摘录原文 |
重要人物名称 | personalName | 有则必备,可重复 | 通用名称或规范名称。属于本项目知识抽取数据条目的人物,可在人物名称后将人物数据的记录标识号著录在[ ]中 |
重要人物事迹 | personalDescri ption | 有则必备,可重复 | 可直接摘录原文 |
重要成果 | achievement | 有则必备,可重复 | 产生的著述成果以及文艺作品、建筑作品等各类型作品 |
表8 地理名称知识内容标引
著录内容 | XML 标签 | 属性 | 说明 |
记录标识号 | identifier | 必备,不可重复 | 指知识抽取数据的记录标识号,是数据的唯一标识符,具体见附件1 |
基础文献记录标识号 | sourceID | 必备,可重复 | 指本条数据的信息来源,字段值取自基础文献元数据 identifier 字段,具体见附件2 |
地名专名 | geographicalNa me | 必备,不可重复 | |
地名简称 | abbreviatedGeo graphicalName | 有则必备,可重复 | |
异名 | variantGeograp hicalName | 有则必备,可重复 | 地名别名、惯用地名、历史地名等 |
行政层级 | administrative Level | 必备,不可重复 | 省、市、县、乡、村分别为一级至五级;古代地名根据当时区划建立行政层级对应表,并给定行政层级。 |
起始年代 | startTime | 有则必备,可重复 | 地名建制时间 |
结束年代 | endTime | 有则必备,可重复 | 地名撤销时间 |
沿革事件类型 | evolutionEvent | 有则必备,可重复 | 分为地名设立、改名、行政层级调整、隶属调整、地理坐标调整、注销、重设等类型。 |
时间 | evolutionTime | 有则必备,可重复 | 沿革事件发生的时间 |
说明 | notes | 有则必备,可重复 | 沿革事件说明,可直接摘录原文 |
规范性文件 | authorityDocum ent | 有则必备,可重复 | 确定沿革事件的规范性文件名称 |
隶属 | underJurisdict ion | 有则必备,可重复 | 该地名上一级行政单位名称 |
辖区 | jurisdiction | 有则必备,可重复 | 该地名下一级行政单位名称 |
经纬度 | coordinate | 有则必备,可重复 | |
参考方位 | azimuth | 有则必备,可重复 | |