简体中文
繁體中文
English
 
浅析中国版本图书馆的全业态智慧化服务




摘要:本文通过统计出版数据分析我国出版领域及以中国版本图书馆为代表的出版服务机构为出版业及相关行业提供数据服务的现状和存在的问题,浅析以中国版本图书馆为纽带建设智慧服务平台、构建数据共享交互机制,融合流程和终端数据,关联实体数据及用户行为等多类型数据,形成数据服务生态,实施多维服务模式,实现基于全业态数据平台开展的图书出版智慧化服务。

关键词:融合化语境 图书出版 全业态服务 智慧化服务

中图分类号:G231


在互联网时代的数字出版浪潮中,出版业正在通过融合而重构,


[1]融合既是不可阻挡的趋势,又是机遇和方向。出版界虽然通过组建出版集团、成立出版联盟等措施在一定程度上解决了成员间“数据孤岛”、数据交互滞后、获取用户需求困难等问题,但基于全业态、全流程的出版数据为出版行业及相关行业的高质量发展提供智慧化服务则是时代发展的新要求。出版业高质量发展问题的提出标志着中国出版业由数量规模型转向质量效益型的必要性。

[2] 5G时代,内容的生产者和用户、服务提供者和服务使用者的边界会更加模糊,

[3]这就需要具有非商业性、跨行业性,且贯通内容生产、监测与用户需求的中国版本图书馆顺势而为,融合流程数据,探索完善服务对象、思路与方法,为出版业高质量发展提供高效、精准服务。


本文以中国标准书号(ISBN)、图书在版编目(CIP)的数据及其服务为切入点,结合出版界存在的问题论述中国版本图书馆开展智慧化服务的现状,找到出版业存在的问题,进而提出以中国版本图书馆为主体,积极发挥自身数据优势、行业影响力,从内容与业务现状及未来规划等角度,思考如何做好出版全业态智慧化服务。


一、中国版本图书馆全业态智慧化服务现状

中国版本图书馆拥有全国所有图书出版单位的图书目录元数据资源,运行维护着书号实名申领(ISBN)、图书在版编目(CIP)和样本库管理三大书目数据业务系统,构建了我国书目信息公共服务系统。[4]特别是中央宣传部出版物数据中心(PDC)数据服务平台在线运行,有效整合了中国版本图书馆的CIP和馆藏样书数据,数据总量已达千万级。与全国六百余家出版单位构建起完善的图书出版数据实时申报、数据监测、书号核发、CIP制作、成书数据上传、图书样本上缴及长期保藏的双向交互机制,是中国出版物元数据最具权威性、实效性、规范性,且唯一横跨出版与图情两大行业,着重服务政务、出版、图情三大领域的国家级事业单位。


改革开放以来,我国出版业蓬勃发展,出版社由1978年105家发展至今600余家,出书品种由1978年1.7万种发展至今每年新书近20多万种,传统纸质出版已经逐步向数字出版转型。出版业界通过成立出版集团,构建出版联盟,布局出版“走出去”等措施与战略,在某种程度上实现了各自出版领域“点”或“线”的新突破与发展。


然而,在出版业取得辉煌成就的同时,多年来出版业发展始终存在高库存、发行市场不统一、行业诚信缺失、零和博弈等问题。究根溯源,从出版机构层面分析,出版业长期所面临问题的根源主要是数据需求无法有效满足,即缺乏甚至没有途径获取完整、准确、有效的全业态数据服务是制约其发展的重要因素,如出版选题数据及选题态势服务、市场营销数据及市场需求导向服务、用户行为数据及用户意向需求服务等。从提供数据服务层面分析,目前除少量书目和营销数据公司外,仅中国版本图书馆唯一一家国家法定单位在进行全业态出版数据的集中获取与服务,但其对于出版业的服务更侧重于传统出版行业数据统计及专题定向分析报告等浅层次数据服务。


1.调整数据服务结构,并行优化图书出版选题


传统出版数据生态服务以概况量化服务促进结构调整工作为主,侧重行业宏观发展趋势研判,而忽略学科间及学科内部差异性分析。从2019年新版图书的《中图法》22大类分布数量来看(见图1),G类(文化、科学、教育、体育)选题有88690种,同比增长0.22%,而最少选题V类(航空、航天)仅有524种。G类中仅教育类(G4/7)选题就有80639种,占G类的90.92%,占年度的28.37%,而科学类(G3)选题仅有412种,文化(G0/2)与体育(G8)数量相当,共占G类的8.61%。2019年5月28日发布的《中华人民共和国人类遗传资源管理条例》明确提出“发展生物医药产业、提高诊疗技术”的要求。经统计,R类(医药、卫生)选题有13952种,占年度4.91%,其中,医学选题比重较大,如临床各科医学(R5/8)选题4876种居首,中国医学(R2)选题3172种次之,而药学(R9)选题仅441种,仅略高于医药、卫生综合性选题。


  分析数据发现,各学科间选题数量差距较大,不同子学科领域选题分布极不均衡,个别领域高度集中,以销量为导向、以热点为导向现象显著,业界竞争过度,而新开创发掘的选题、有影响力的选题数量持续偏少。长此以往,就会产生图书质量良莠不齐,损害读者利益和出版社品牌,造成图书高库存、浪费社会资源等影响。[5]以上现象产生的深层次原因与出版单位无法动态了解出版行业宏观及微观层面的选题发展趋势和细节分布不无关系。中国版本图书馆需要基于行业定位并结合文化发展方向,从全业态数据服务层面注重已有数据的层次差异化及细颗粒度建设研究。除提供常规宏观量化性统计分析服务外,更应结合不同出版单位的选题特色和方向,将量化统计与内容分析进行多层面的融合挖掘,保障出版单位实时地准确掌握与其相关出版领域的选题热点。从源头上让不同学科领域的出版单位在各自学科领域实现图书出版结构的自行优化与宏观导向优化有效结合,实现内容层面的出版数据生态构建与完善。


2.发挥数据时效价值,多元化促进高质量出版


出版数量庞大、重复出版严重是当前图书出版最显著的特点。[6]经统计2019年我国新版图书数据(为避免书名相同而内容不同的问题,对书名及其对应二级类号并行统计),得到重复书名21 112种,涉及数据117 660条,占年度41.40%,公版图书642种,数据6 997条,占年度2.34%。在公版图书中,四大名著及其改编图书数据有683条,占公版图书总量的9.76%,仅国外经典寓言童话,如伊索寓言、安徒生童话、格林童话及其改编图书数据有244条,占公版图书总量的3.49%。对标识图书内容的主题词进行统计,有19 923组主题词重复,涉及图书199 733种,占年度70.28%,其中,“儿童故事-图画故事-中国-当代”主题有4 728次,“小学数学课-习题集”主题则有4 401次;而涉及少儿主题的图书有17 889种,数据26 844条,年度占比9.45%,《奇先生妙小姐全新故事集》(118种)、《森林报》(64种)、《儿童百问百答》(56种)位居前三。


统计数据表明,在已完成出版的图书之中,有相当比例的图书内容重复,同质化出版现象明显。在传统的出版生态体系中,多数出版社单位均会考虑经济因素从而注重公版图书的再版,考虑市场营销热点而积极开展大批量儿童文学选题的布局,特别是个别出版单位创新策划成功的营销选题更成为众多出版单位争相模仿的新宠。分析其中原因,同质化及重复出版的根源之一在于定题阶段对行业相关选题数据掌握不充分,市场需求数据获取延迟及用户新需求数据不可预测所致。


从出版数据生态流程及环节考虑,全国出版申报选题前沿动态数据仅有中国版本图书馆的ISBN和CIP两个环节可以掌握,对于重要时间节点及热点选题会引发大批量出版单位的集中爆发式申报且互不相知,且时效性也会随着图书正式出版而转瞬即逝。要避免同质化及重复出版等出版问题,就需要中国版本图书馆基于全业态平台,融合传统出版、市场营销及用户需求数据,针对不同类型出版单位进行行业大数据基础上的实时定向服务。如提供选题动态预警服务,发挥出版生态申报数据时效价值,辅助出版单位从源头上解决同质化出版等问题,实现出版行业多元化、特色化高质量发展。


3.智能关联业态数据,促进实现精品创新出版


由于经济利益驱使,开辟市场能力不足,部分出版单位缺乏明确的品牌定位,没有长期发展目标与发展规划,造成出版跟风现象盛行,特别是只为追名逐利的跟风盛行。[7]通过对2019年新版图书(教参教辅除外)进行书名、作者、分类、主题词等内容的数据筛选,得到疑似庸俗跟风选题图书2 072种,全年占比0.7%,其中成功心理类最多,有760种;人生哲学类次之,有590种。关于跟风,我们坚决反对“东施效颦”式的拙劣跟风,但也需要守正出新的“跟风”之作;关于原创,我们积极倡导与肯定,出版单位则需明晰自身特色,策划原创选题。中华文明传承千年而熠熠生辉,近年来党和国家倡导坚定文化自信,大力弘扬中华优秀传统文化,延续和传承文化的出版业须在挖掘与发扬中华文化过程中发挥其独特的作用,这是出版业的使命,更是符合时代发展主旋律的出版要求。


经统计,2019年涉及中华文化的选题有1 275种,涉及《中图法》13个类别,中小学教参教辅居多(824种),中国历史(384种)次之,其他类别选题数量多是个位数;“非物质文化遗产”选题251种,以地方性非物质文化遗产介绍为主,在内容上,地方戏、体育文化、少数民族文化选题数量略多。以上数据表明,关于中华文化的选题还有广阔的研究空间亟需出版业去探索与发掘。创新战略是企业战略的关键组成部分,在企业战略中起关键作用。[8]出版单位唯有借助全业态出版关联性数据决策分析技术支持,了解自身的特色及选题优势,才能有效服务于本身的创新发展战略。中国版本图书馆需要基于语义延伸、关联扩展等智能算法实现全业态选题数据的知识图谱呈现及智能报告生成等服务功能和产品,让出版单位明确其在行业的战略地位、核心竞争力及创新方向,助力出版单位将创新发展战略的目光扩展到每个可触及的优势学科领域,形成技术创新、理念创新、战略创新、产品创新的发展路径,并可对某一专题领域进行深度聚焦,不断挖掘自身及周边领域丰富的文化知识内涵。


4.突破人才制约因素,有效提升队伍信息素养


传统的出版创新更侧重于编辑的独立创新,需要编辑做调研选题、整理素材、联系作者、分析数据、撰写方案、与专家深度论证等系统工作,才有可能打造出精品。中国出版集团公司原总裁、中国韬奋基金会理事长聂震宁曾阐明出版社之所以重复出版,主因是“出版社在挖掘、策划、培育新品种方面乏力,但还要保证一定的生产量和销售量,那么很可能就会选择最简便的办法”。2019年选题数据涉及责编人数不足2万,而选题总量近30万,基于我国每年图书出版选题总量及责编的从业者人数对比分析,在无集成性、智慧化数据系统或平台进行服务保障与支撑的情况下,责编如需进行全业态、多领域、广泛而深入的调研,有效完成相应选题的创新、策划及决策等工作,所耗费的时间与精力则是巨大的,且客观条件也不允许。


习近平在中央政治局第二十一次集体学习时关于新时代干部人才队伍建设强调“加强思想淬炼、政治历练、实践锻炼、专业训练,使广大干部政治素养、理论水平、专业能力、实践本领跟上时代发展步伐”。作为创新核心的编辑则需要从工作职能和价值层面重新审视自己。编辑除具备传统的专业知识和职业技能外,还要掌握人工智能的思维模式和操作方法。[9]中国版本图书馆应从行业外部着手,打造出版数据生态及智慧化服务平台,通过语义技术在选题、审校、推送等方面的智能化算法与技术并辅以专家智库的建议指导,让编辑从市场调研、素材整理、寻找创意等系列繁杂性工作中解放出来,增强编辑智能化应用意识,让编辑发挥在选题把关、引领创新、内容干预等方面的核心作用。打破出版行业人才单一化及条块分割现状,提高人才信息素养,形成一支高水平、复合型的出版人才队伍,发挥其在选题各方面的主导作用,出版工作模式将由独立摸索转变为智能化辅助基础上的科学决策。


5.建设泛在出版生态,智慧服务支撑融合发展


近年来,出版集团及出版联盟的建立虽在一定程度上实现集团及联盟内部数据生态构建,但各成员之间多以独自管理形式为主,从资源层面并未实现数据共享。这样优化资源配置的目标无法实现,与集约化的要求还存在一定的差距。[10]构建局域融合出版数据生态以出版单位、集团或联盟为主体,而中国版本图书馆是唯一具有构建全国出版生态服务,并打造泛在出版生态的平台。基于第三方传播渠道的内容服务,在内容形式上更多采用资源的数字化,数字内容服务缺乏一体化管理模式,生产与传播相分离,传统出版在进入新数字领域时缺乏理论与规划,仍有许多问题没有解决,包括内容转型、盈利方式、服务模式等。[11][12]发挥中国版本图书馆“桥梁”作用,联通出版、市场、用户群、相关环节的数据生产及服务单位,充分应用5G、人工智能等信息技术,实现出版相关领域的数据互联,构建起全国甚至全球范围的数据状态全感知、应用灵活便捷的智慧服务出版生态。把分散在不同流程环节、不同领域学科的元数据集进行集约化管理,运用智能技术为数据赋值,实现出版数据价值最大化、整体数据最优化的运营管理。在服务应用层面,根据不同出版单位的学科定位及数据需求,提供差异化、特色化、集成化数据分析服务,为出版业实现图书融合发展提供全方位、全流程、多纬度的数据支撑服务。


二、出版数据服务业界存在的问题


近年来,出版业面临转型,新的需求及诉求集中突显。如当前教育类出版社在线教育业务也呈现良好的发展势头,但在线教育业务系统的发展呈现多样化,各类独立运行的业务系统亟待进行统一规范化的管理和运营;[13]智慧出版迫使出版业必须将人工智能、大数据等最新科技与传统出版有效融合,从而实现智能化知识辅助操作,为用户提供全方位、个性化、智慧化的阅读服务;[14]传统出版要从人力资源、资金支持、技术手段、产品内容等方面深度融合最新数字科学技术,突破发展瓶颈及制约因素,实现出版内容、技术应用、平台终端、人才队伍的共享融通。[15]这些已经成为我国出版业界进行规划战略调整必须认真思考的核心问题。中国版本图书馆在为有关单位提供服务的内容、方式、层次上还存在较大提升空间。


1.智能服务生态尚待完善


目前,中国版本图书馆三大业务系统拥有书目信息资源优势,业务服务流程主要是出版单位依据申报表单如实填报预出版图书信息并申报书号及CIP,待返回书号及制作完成的CIP后再进行图书印刷。但各业务系统间数据缺乏一致性、数据流延续性弱、综合时效性偏低,数据融合和共享程度不高,出版生态流程的终端(市场营销及用户行为数据)环节并未打通。服务出版业的主要方式为书号核发、条码的制作、CIP制作、网络文学标识符标注(试点)等常规业务服务,各业务服务体系数据关联与交互急需加强。


2.服务政务水平仍需提升

我国《出版管理条例》第一章第四条规定,“从事出版活动,应当将社会效益放在首位,实现社会效益与经济效益相结合”[16]。相较于经济效益指标可量化的指标体系特点,社会效益由于缺乏具有普适性和可行性的量化指标、评价因子、权重衡量等,[17]致使对出版单位的发展情况评价,依然以经营规模为主要依据。目前,书号、CIP及市场营销数据是出版决策的主要数据源,存在数据源分散,多端获取、数据集成困难等普遍现象。数据处理智能化水平不高,监测及预测性工作以人工定向分析为主,在时效性、特色性及数据交互性方面缺乏灵动性。


3.服务图情亟须深度融合


CIP诞生初衷是关联出版与图情两大领域,实现一次制作、多次应用的目标,而目前我国CIP对图情服务的功能几乎空白。图书馆不仅是出版业的重要消费用户,也是终端用户有效数据的采集和拥有者,从图书销售到阅读流程中承担着重要的媒介作用。图书馆、博物馆和档案馆机构间展开密切服务合作,提供一站式的服务平台成为战略需要,引起了学术界与文化机构的广泛关注。[18]但图情行业与出版行业的数字融合交互深度却极为有限,中国版本图书馆虽与图情行业保持服务关系,但融合终端用户数据的智慧化水平却有待进一步提升。


4.服务受众有待广泛扩展


通过调研分析发现,我国目前出版数据服务公司主要有以一线门店销售数据及以市场营销数据为基础开展的数据服务业务两种类型,数据的完整准确及时效性欠缺,而部分书商却对营销数据的准确性、实时性有着较高的需求。中国版本图书馆拥有全国最完整的出版过程数据,能够实时动态反映全国图书出版选题历史发展脉络及前沿态势,并收藏新中国成立以来我国最完整的纸质图书资源,如此丰富而权威的实体与数字资源对于相关科研人员、信息科技企业、学者与个人都具有重要的研究、参考及购阅价值,开展面向社会不同群体的出版数据服务已经尤为迫切。


5.人才梯队建设急待加强


纵观出版行业现状,出版行业人才单一化现象突出,各业务模块条块分割,形成编辑、策划、印刷、销售、发行,数据交互以流程性工作为主。融合发展促使出版业不断进军影视、娱乐、教育等众多领域,跨领域相融互通势必依赖于从内容到形式、从产品到精品、从出版物到衍生物的重构和融合创新型出版人才。[19]以中国版本图书馆为代表的出版数据服务单位在人才建设过程中侧重业务型与研究型人才的引进与培养,但与出版行业人才结构类似,同样存在不同类型人才交互甚少,对数据认识存在分歧,信息意识、科技化工作服务水平较低的问题,基本以“传统手工”及“人海战术”工作模式为主。在信息革命大背景的当下,如果没有一支高知识含量、复合全能型的出版及服务人才队伍,就无法真正实现出版业的高质量发展。


三、数据融合平台布局智慧服务


当下出版业主要矛盾在于人们日趋多样化、立体化的文化(信息)消费方式和出版单位单一的、粗放式的生产方式之间的矛盾,[20]而新业态的出版时效性要求更强,甚至需要对选题市场做出科学的预判,而满足新时代出版业高质量发展的要求,仅仅通过局部性地对后期市场营销数据进行调研、分析是不理想的。中国版本图书馆基于出版全业态数据及智慧化平台建设,提供时效性强、数据权威、全流程数据等服务,助力出版单位快速打造出具有正确价值导向和双效的作品。


1.融合内容,构建数据共享交互机制


5G会使我们整个社会出现一个新的数据中心 ,[21]中国版本图书馆则具有打造智慧出版数据平台能力以及承担起建设未来出版信息中心的使命。出版单位作为图书资源的创造者和发布者,要进行高质量图书出版,不仅需要出版行业元数据,更需要结合行业流程与终端用户反馈的数据才能进行全面科学的选题决策。而中国版本图书馆与图情等终端的内在联系,能够有效关联起出版业与相关行业,建立起出版数据流从生产到用户的闭环,构建完善的出版数据生态体系。加强出版业内部前端及中端数据资源的融合工作,更应重视终端数据的采集与集成,采用人工智能、自然语言处理、大数据及语义技术,融合CIP、书号、音像电子、网络出版物等数据的智能化采集和数据加工,实现自动采编(ECIP)的场景落地、行业ERP无缝对接及功能扩展,将数据采集的源头扩展到文化、数字等相关企业领域。前端采用“富”申报端的模式替代现行手工上报方式,注重选题全文的智能化采集及应用,基于出版ERP自动获取出版社端载体数据及样本流数据,智能提炼图书题要及识别所需著录项并完成数据自动上报,避免人工漏报、误报、选报或瞒报等问题。在相应流程自动触发业务机制,以减轻当下一书多报、多头上报等耗费出版单位人财物资源等问题上,实现常规数据申报智能辅助化操作。后端则基于信息安全和隐私保护技术,采用成员共建、协议交换、公开获取等机制,建立起实时、准确、全面的出版物元数据平台,进而关联实体、营销、用户行为数据、增值元数据并为深度数据服务提供可用性支撑。


2.扩展服务,形成良性出版数据生态


出版单位由于并无直接联系大量读者这一终端用户的“桥梁”,因此无法充分了解读者购买后有没有阅读、阅读中有什么疑问、还有什么需求未被满足等问题。[22]中国版本图书馆可从全流程数据出发,综合出版前端(采集书目元数据)、中端(规范化标准书目数据)和终端(市场营销及用户行为数据)全业态数据流,进而整合多终端数据,构建智能动态交互的良性数据生态体系(见图2)。通过与图书馆、科研院所、经销商、网店、信息企业等单位建立合作关系,解决出版活动中产品供应方和市场需求间的信息脱节问题,达成各方利益平衡,形成相对综合稳定的出版生态服务架构。


  5G时代,出版融合不再只是文化产业间的简单融合,而是超出传统出版和信息技术的融合,将是出版与制造业的融合、出版与交通运输业的融合、出版与服务行业的融合等。[23]智能互联将通过终端融入与出版融合发展各个领域,打造多方积极参与、数据源丰富多样、内容优势互补的出版数据生态体系。智能发掘数据价值,服务相关行业单位,让出版数据融合政务、深化服务、融入项目、促进产业。


完善业界生态元数据,构建著者、编辑、图书、数据、读者的多维矩阵,进一步关联实体及网络资源,实现数据利用、“可见即可得”的智能可视化服务支撑,提供专业性强、实时精准、导向明确的深度数据服务。在为出版业提供需求明确、资源丰富、时效性强等综合保障的同时,更侧重助力出版单位打造高质量的精品选题,助其打造独有IP产品系列。将数据与科技有机融合、科学集成,提供高效、智能的选题决策、内容追踪、科研诚信评估、成果评价、行业景气指数、竞争情报分析等精准服务,形成特色服务生态及内容生态化发展(见图3)。


3.知识发掘,实施多维立体服务模式


面对海量业务及用户需求数据,辅助出版相关单位做好供给侧服务,实现技术应用与内容创新并举,导向引领与服务方式并举。为用户提供更加高效、方便的知识发现,而不是数据提供。[24]国家新闻出版署要求建立数字出版精品遴选推荐机制,发挥精品选题示范作用,该机制对于促进出版产业深度融合及高质量发展意义重大。首部书籍对于出版单位而言,不再只是经济利益层面的考量,更多的是品牌认识层面的战略布局。在政策与发展的多重驱使下,很多出版机构开始注重自身产品线建设,希望走出差异化的路线。[25]要满足出版市场对内容和形式多样化发展的需求,就需根据出版单位的选题特色及学科知识特点,在特色及个性服务内容深度上下功夫。大数据智慧化时代的到来,数据资源整合、全媒体融合以及通过对数据的挖掘实现个性化信息定制服务等,[26]必将成为出版产业转型与重构的主要因素。


因此,树立用户为中心的服务理念,基于用户需求创新服务,[27]借助出版全业态数据深度挖掘等信息技术,做好内容的精准化、纵深化、专业化、多元化的特色信息服务,更需要研发符合用户需求且可灵活自行定义或专向定制的服务产品。产品形式上应有数据产品、二次资源产品及智慧化衍生品,也要有易操作、实时交互、满足个性需求的技术产品。同时,做好实体产业与数据服务的交互,注重数据服务周期性孵化和综合性培训,构建扩展新型线上线下、从点到面的立体交互型服务模式。

基于智慧服务产品,发挥智能技术时效性优势,实时进行终端产品数据资源赋能,助力出版企业布局发展型人才资源战略,提供人才梯队结构合理的服务保障体系,培养出具有高度业务共识、信息素养、科研攻关能力的复合型出版人才队伍(见图4)。

4.规范数据,建设智慧信息服务平台


随着5G及物联网技术的发展,以出版大数据为支撑构建一体化出版数据智慧服务平台,要实现基于不同流程及领域的元数据融合,做好辅助选题决策,并实现差异化出版,降低编辑与出版成本,提高作品畅销的成功概率等服务功能。[28]核心任务是优化顶层体系设计,完善基础数据规范,进而融合业务数据流资源的共性,消除差异性。在顶层标准体系设计层面,应从行业基础、技术手段、产品应用、安全管理等多维度建立健全业态标准体系。在基础数据规范层面则应参照CNMARC(中国机读目录)、CNONIX(中国出版物在线信息交换图书产品信息格式规范)、DC(都柏林核心元数据)、RDA(资源描述与检索)等标准数据项的设计规范及要求,制定或采用能够有效兼容图书出版、营销、书号、条码、音像电子、网络文学、CIP、用户行为等格式与流式数据类型的数据资源描述规范。


统一标准框架系统及规范元数据应用能够有效兼容传统业务数据,实现概念统一、外延明确、易扩展等特点,解决制约出版服务的“数据孤岛”、数据概念冲突、数据对接困难等问题,进而消除行业内部各层级数据界限,打通全流程数据通道。助力数据平台迭代发展,为平台的升级、发展及扩展提供基础性支撑,使业务流程从扁平化向立体化发展,从独立型向关联型发展。



全业态出版数据智慧服务平台(见图5)基于统一元数据标准规范,采用“富”客户端模式实现源数据的自动采集及结构化交互,形成智慧终端。平台“大脑”对流入源数据进行智能化关联,形成分层次、多维度、全矩阵的专题库、作者名录库、出版单位库等系列规范库。


平台采用自主学习算法进行元数据的图谱、画像等可视化,结合不同学科领域的实际情况,建立相应算法模型,衍生出松耦合式知识型数据资源产品,以智能检索、快速报告、精准推送等形式,为用户提供快捷迅速、专业性强的特色数据服务。在服务形式上应由被动要求式服务向主动推送式服务转变,在服务手段上应由人工为主向人工智能辅助形式转换,在服务内容上要注重深度分析、热点实时报告、出版因子、出版态势研判等深层次数据挖掘服务。


(作者单位:中国版本图书馆)




本文转自   出版发行研究 公众号 ,仅作为知识普及,如有侵权,请联系本公司工作人员删除


出书大师 | 作者入驻 | 关于我们 | 网站安全 | 联系我们 | 网站首页 | 加盟代理 


Copyright ©2018 zuozhebang.cn 版权所有:真自信息科技(上海)有限公司

网站备案号: 沪ICP备18003907号-3 沪ICP备18003907号-2|出版物经营许可证: 新出发沪第U7332号|计算机软件著作权登记证书:软著登字第3440436号|广播电视节目制作经营许可证:(沪)字第04185|

网络文化经营许可证编号:沪网文(2021)1152-084号|增值电信业务许可证号:沪B2-20201633|股权代码:368155

公司地址:上海市闵行区新源路1356号正珏科技园A座316室