海外出版商在用AI做什么?

海外出版商AI

  近几年,中国、日本、英国、欧美等国先后将人工智能(AI)确定为国家战略,对AI的资金投入逐年攀升,以此提升国家竞争力。中国也早在3年前就加入了AI创始国行列。至今中国已成为全球范围内AI研究领域最大的参与者。作为消费者,我们的日常生活已经被AI包围,每天都在接触着AI。通过地图软件了解如何避开交通堵塞、找到去办公室的最近路线;过滤掉垃圾邮件;在网站上像机器人一样提问;得到音乐上的建议;得到工作上的建议;了解其他消费者都做了什么,等等。这些交互信息帮助我们从与系统的互动中找到答案。与此同时,AI技术在出版业也有愈来愈广泛的应用,为企业和用户提供更多的应用场景。
 
  英国出版商协会在去年11月~今年3月间对130多位会员进行电话访谈及线上问卷调查后,近日发布了名为《AI在出版业的作用》的分析报告。报告称,AI目前被应用于学术、教育和大众出版商的整个价值链,来帮助企业提高IP版权保护水平、内容可见性及市场预测和其他策略分析能力,帮助用户进行常规搜索和分析性总结,由此生成新的市场洞察。AI技术还可以节省研究人员、作者、老师和消费者的精力,专注于做有附加值或创新的事情。
 
  该报告显示,英国大多数出版商从2017年开始对AI技术进行投资,在出版社内部成立小型AI研究团队(其中有一半的出版社将AI业务团队设在英国本土),或者与AI技术公司和大学研究人员共同合作进行AI的研发应用。
 
  大型出版商使用AI技术来获取并开发新内容,有3/4的大型出版商已经或准备在2年内将AI技术用于营销和销售环节。
 
  出版商认为,AI会对出版商的竞争环境带来巨大影响,有2/3的出版商预计未来将与不同类型的出版机构展开竞争。大多数已经应用AI技术的出版商都意识到AI投资的益处。从不同领域看,学术出版商可以运用AI技术支持科研成果的分享、发现相关同行评议人并对研究成果进行核实,帮助研究人员进行论文查重、侵权筛查,并为高质量的科研提供高质量的可见数据。学术出版商将是AI技术的最大受益者。教育出版商运用AI技术开发教育内容,可以为学生提供更好的学业分析及个性化学习解决方案,让教师有更多时间用在学生身上。在大众出版领域,AI技术可以生成消费者内容,可以帮助作家节省日常调研时间、增加作家创作产量,出版商很快将开始营销AI生成的小说。但AI技术生成内容的版权如何归属和判定,需要对版权保护法相关细则作出明确的法律界定,为出版商购买作品版权创建稳固的投资环境。
 
  AI在出版业主要应用机器学习(ML)、深度学习(DL)、自然语言处理(NLP)、语言识别及计算机视觉技术。AI技术可以帮助出版商对内容进行分类,如使用元数据标记,将图文识别技术与ML和DL技术整合起来,并结合搜索引擎来改善内容可见性;可以帮助出版商发现市场趋势,改善企业经营效率、成本结构以及用户体验,并为平台的推荐服务提供支持。所有大型出版社在接受调查时均表示,将在2年内使用AI技术对内容进行分类。
 
  该报告指出,为增加出版商对AI的投资水平并给消费者带来更多利益,必须克服许多投资障碍,如缺少AI技术人才,难以将AI解决方案用于原有基础设施及整合不同部门。对小型出版社来说,困难在于中前期阶段要为AI研究和实施支付大量的投资成本。
 
  因此,报告建议英国政府及业界提高对AI投资关键问题的认识,完善相关政策,共同推动AI应用及其他解决方案的实施。提出的主要建议包括:进一步完善版权保护法,促进出版商与关注AI的中小企业和学者之间的合作,帮助中小出版社在金融和技术方面得到AI技术的支持。该报告建议政府应通过设立挑战基金(Challenge Funds)的方式,支持并鼓励学者和技术型中小企业共同参与到AI技术应用创新中来。
 
  英国出版商协会主席兼泰勒与弗朗西斯CEO安妮·卡兰南(Annie Callanan)认为:“数字解决方案在整个疫情期间让我们受益良多,技术的发展使虚拟活动得以实现。技术让身处各地的我们连在一起。我们运用技术产生了显著结果,同时,我们也要问自己,技术能实现什么?随着出版商对技术应用的不断创新,我们可以信任法律来解决问题吗?”她强调指出,AI技术不是要替代人类,而是解放人类,让人类更有创造性,能够探索新的研究领域并改变教育的方式。
 
  英国出版商协会AI办公室数据负责人克莱尔·查普曼(Claire Chapman)表示,掌握AI技术是目前中小企业面临的困境,英国政府已向16个中心投资1亿英镑用于技术培训,另外投资5000万英镑吸引AI顶级技术人才。她透露,政府将开设商务投资主题的AI研究生课程,发布2500个AI和数据科学的学位转换课程,将面向1000位课程学员颁发奖学金,来吸引更多人参与AI的学习。该协会知识产权办公室负责人罗斯·林奇(Ros Lynch)表示,该部门将督促出版商积极运用AI技术,并提供对AI应用的分析。
 
  (本报选取了9月在京举办的第12届中国图书馆馆长与国际出版社高层对话论坛及英国出版商协会的《AI在出版业的作用》分析报告中的5个案例,来阐释AI技术在出版业的广泛应用。)
 
  AI应用案例1
 
  AI技术实现智能推荐 释放科研活力
 
  爱思唯尔产品副总裁罗斯·惠里尔(Rose L’Huillier)以ScienceDirect平台(以下简称SD平台)为例,介绍了该公司如何运用AI技术,帮助研究人员进行科研并促进科学发展。
 
  她表示,在信息泛滥的时代,研究人员处理大量数据是极其困难的。他们期待有足够的工具构建和解释海量信息。同时,研究人员做学术研究时发现,研究变得越来越跨学科。很多未知的术语正在被使用,而研究人员通常需要更多的信息来源。此外,研究人员在搜索和阅读文章的过程中浪费了大量时间。
 
  爱思唯尔在一年多前,通过使用机器学习(ML)和自然语言处理(NLP)技术,并借助关键词共现来构建AI领域,探究在这个领域使用了哪些不同的技术。惠里尔以两个例子来说明SD平台上如何运用AI来帮助研究人员开展科研工作。
 
  一个案例是运用AI技术创建SD主题页。她指出,主题页就像一个科学的维基百科网站,用户通过它可以找到关于特定主题的基本信息。研究人员可能会遇到一些具体问题,如浏览一项科学研究时,遇到了一个不理解或不熟悉的领域中的专业术语,想更多地了解它。这时,研究人员可以通过点击由AI完成的链接进入主题页。研究人员也可能希望搜索某一领域的更多信息,SD制作一个可以被搜索引擎发现的主题页,便于研究人员通过搜索引擎找到这些专业术语的可靠来源。
 
  通过建立主题页可以使用户快速了解某个概念的相关信息。在主题页面上显示主题名称、从书中摘取的对该主题的简要描述,以及从一些图书或文章中选取的与主题相关的信息片段及其他主题页面上的相关链接,来帮助读者了解与该主题相关的基础知识。这样的主题页面完全是借助AI技术自动生成的。这些技术已经运用到所有主题领域,目前SD平台上有30万个主题页,每月有近两千万次的访问量。
 
  在运用AI技术生成主题页时,首先通过不同领域使用的15种分类法来确认哪些概念是希望建立的主题页。然后利用数据挖掘技术来运行分类法,选出想要使用的章节和文章,并生成主题页。之后再运用NLP技术选择相关信息片段。
 
  NLP技术可以帮助我们确定哪些文章内容与该主题最相关,以及应选取多大的信息片段。有了一些信息片段后,我们就要确定哪个信息片段要优先展示,使用相关性排名运算技术会有助于揭示相关性最高的信息片段。最后一步是在整个过程中加入一些人工干预,以保证数据质量。
 
  她指出,需要从学科专家那里获取反馈意见以确保质量。在这个过程中可能会有一些主题是关于其他学科的,对此要进行特别处理。除此之外,主题页会进行自我纠错。ML模型使得数据质量不断提升并且持续了解用户浏览的信息片段,积累数据分析的信息。
 
  另一个案例是运用AI技术提供推荐服务。推荐服务可以预测用户是否喜欢一篇文章,以及这篇文章是否与用户相关。SD的推荐服务可以帮助读者减少搜索文章的时间,提高阅读文章的相关性,并且提供人工搜索难以找到的答案。在推荐服务的帮助下,爱思唯尔帮助研究人员找到了通过其他方式找不到的文章。
 
  她介绍,SD平台从3年前开始,基于在SD上阅读的文章,为注册用户提供个人推荐服务,并一直在改进其背后的技术,如运用AI技术收集用户反馈、用户点击次数等数据,以及基于最相关筛选技术,推荐看过这篇文章的其他用户浏览过的相关性文章,这大大提升了推荐服务的文章质量。此外,运用ML排序算法来确定每个章节文章的相关性排名,并通过用户点击率来发送反馈信息至系统中,使系统可以判断哪些是相关的,由此确定下一次推荐文章的呈现顺序。
 
  根据用户的阅读历史、浏览内容的相关性以及ML排序算法做推荐,意味着使用更多数据作为输入项来进行推荐,使得输出的推荐结果也与用户更相关。SD平台还向注册用户发送相关推荐内容的电子邮件或在SD个性化设置中找到推荐内容。近期,SD平台又推出了Beta版本的、基于用户反馈信息的个人推荐控制面板和移动应用程序。用户在选择将哪些内容作为输入项推荐文章方面也有更多的自主性。这样,推荐服务也实现了由用户提供推荐依据,由此选择不同的输入内容,如输入项可以是用户出版历史记录。研究人员在Scopus中声明作者信息,SD平台就可以结合整个出版历史记录,提供相关推荐文章。
 
  另外,用户在SD平台上的浏览历史记录以及Mendeley Library中存储的信息,都可以作为个性化推荐的依据。用户可以定义一组想设置推荐的文章,如选择推荐与其中一篇或者多篇自定义文章关联性最高的文章。此项推荐服务可以实现用户负责推荐依据,可以选择不同的输入内容。
 
  惠里尔表示,今后这项推荐服务将不限于推荐SD平台上的内容,还将扩展到Scopus平台上所有索引的内容,这项推荐服务也被称为“Scopus Discovery”,这样就可以让研究人员的工作变得更加轻松。
 
  AI应用案例2
 
  AI技术改进与拓展对研究人员的服务
 
  施普林格·自然集团大中华区总裁安诺杰(Arnout Jacobs)介绍了该集团是如何运用AI技术改进和拓展服务研究人员的能力,推动科学发现的。他指出,运用AI技术改变科技出版主要体现在出版、传播、基于出版内容上的服务和非出版服务四个层面。
 
  第一,在出版业务中,AI可以帮助出版机构寻找图书作者,帮助作者寻找合适的出版物,并实施更为精细的质量控制,如筛查内容,减少剽窃、数据操纵及图片造假等,还可以协助同行评议人的工作并帮助编辑进行决策等。
 
  第二,在内容传播过程中,AI可以帮助出版机构生成数字链接,从而借助社交媒体等平台提升内容的可见性,通过ML算法等工具帮助研究人员发现所需要的研究内容,帮助资助机构追踪了解已出版研究成果的应用及再使用等情况。
 
  安诺杰以论文为例,介绍了AI如何提取科学文献中的数据和信息,并存储于不同的数据库以提升论文的影响力。AI技术不仅应用于论文,还应用于图书出版。去年9月,施普林格·自然集团联手德国歌德大学共同推出云计算软件Beta Writer,在此基础上,汇聚数据研发团队、全球化学、材料科学等学科专家及法兰克福大学的优势,出版了第一本运用AI技术自动生成的图书《锂离子电池研究报告》,运用集群技术识别每个输入项的特定领域和范围,依据相关性通过优选确定呈现顺序;然后运用自动汇总技术进行摘要提取;最后运用聚合和释义技术改善内容可读性。今年9月该集团又出版了3本自动翻译的图书,这些图书由机器从德文译成英文,同时经过人工检查,以确保内容的可读性,由此节省了翻译成本。
 
  但安诺杰也指出,机器能给人类以帮助,但无法生成全新的思想。人们想学习和寻找什么内容,机器无法知道,但可以帮我们去实现。此外,AI工具还能自动搜索图书内容被引用、下载、关注,以及被媒体提及的情况,帮助研究人员和机构追踪了解科研成果受到的关注和产生的影响力。
 
  第三,在基于出版内容的服务方面,AI能自动生成和运作内容摘要和索引数据库,帮助建立新的增值内容集合数据库,以延长内容的使用期。用户还可以从出版内容之间的关联中获得新的思路,建立新的数据库,发现新的内容。此外AI还用于自动进行客观的科研评估。他以施普林格·自然集团免费提供的工具科研图谱(SciGraph)为例,介绍了该关联数据平台是如何帮助用户分享数据、了解研究趋势并提升内容可见性的。
 
  第四,AI还使科研服务扩展到论文提交之前等阶段。在这一阶段,AI工具能帮助研究人员撰写或合著论文,开展研究、克服论文撰写中的语言障碍等。此外还能通过ML算法分析试验数据,通过软件帮助研究人员规划试验,节省时间和资源,加快科学进程,还可以帮助浏览现有文献,以明确研究重点和方向等。这些AI工具包括施普林格·自然集团的SN Experiments,以及姊妹公司Digital Science旗下的Figshare和Dimensions所开发的各种工具。
 
  AI应用案例3
 
  AI技术助力研究人员更快发现相关成果
 
  爱思唯尔2013年收购社交平台Mendeley后开发的Mendeley Suggest工具,以及泰勒与弗朗西斯和丹麦人工智能新c创公司UNSILO的合作表明,AI技术在帮助研究人员发现相关成果方面具有很大的价值。
 
  泰勒与弗朗西斯和UNSILO的合作旨在为泰勒与弗朗西斯的内容生成元数据,便于出版社创建一个推荐引擎,便于用户发现该社的相关内容,也有助于该社内容被Google Scholar等搜索引擎发现和广泛使用。研究人员可以使用NLP技术阅读学术内容,创建知识库,更快发现最有价值的、可制成标签的关键词。还可以运用NLP技术的反馈回路,对算法进行微调。
 
  泰勒与弗朗西斯公司预测,高质量的数据便于研究人员更快发现相关内容,出版社也可以通过提高可见性增加销量。
 
  Mendeley Suggest工具使用ML技术向用户提供内容推荐及科研合作的建议,Mendeley平台上的协同过滤功能可以根据用户过去的使用记录预测用户偏好。Mendeley平台还可以帮助用户开展跨学科合作,如帮助巴斯德研究所等机构发现新的研究成果,帮助国际粮食政策研究所跟踪及传播学者的文章。
 
  AI应用案例4
 
  麦格劳-希尔完善两大AI平台 提升教学服务水平
 
  近年来,麦格劳-希尔集团在AI技术领域投入不菲,其开发的AI技术支持的ALEKS和SmartBook两大平台,展示了AI技术在为师生带来更大收益方面起到的作用。
 
  2013年收购ALEKS公司后,麦格劳-希尔集团与加州大学团队共同创建了ALEKS平台(Assessment and Learning Knowledge Spaces),该项目获得了美国国家科学基金会的资助。平台使用AI技术向数学、科学、商学院和高校学生提供个性化内容。该平台运用AI技术收集学生的30个问题,以此了解学习者对知识的掌握程度,这可以帮助教师决定用哪个主题进行授课。
 
  麦格劳-希尔集团的另一个AI平台SmartBook是由丹麦的教育技术公司Area9开发的,2014年该公司被麦格劳-希尔收购。SmartBook是一个自适应阅读工具,2019年进行了升级。该工具可以给学生提供有重点标注的教材内容,使用AI技术来了解学生掌握情况,并引导学生强化未完全掌握的知识内容。
 
  麦格劳-希尔集团认为,学生从这些平台可以增加参与度,改善学习效率,提高学习质量,从而提高学业成绩。教师可以得到学生成绩提高的分析报告,迅速了解学生对知识的掌握情况,发现学习出现问题的学生。这些平台也成为企业招聘新人的工具,如布鲁内尔大学在学校开放日推介各招聘企业使用SmartBook平台了解学生学业情况和职业发展潜力。
 
  AI应用案例5
 
  AI软件助力生成高人气游戏和故事
 
  今年5月,埃隆·马斯克的AI研究实验室OpenAI发布了GPT-3软件,用户可以用该软件进行个性化测试并生成故事,由人类来编辑和审核。类似的运用AI技术开发的软件也越来越多,这也使大众出版市场呈现出更丰富的面貌,运用AI开发游戏和新故事成为值得关注的一个新现象。
 
  美国杨百翰大学学生尼克·沃尔顿(Nick Walton)开发的无限文本冒险游戏《AI地牢》(AI Dungeon),自今年1月上线以来下载量突破1850万次,每月活跃玩家超过100万。这款游戏采用了AI技术,玩家刚一进入故事场景就要作出选择,由此生成不同的情节,玩家可以与游戏中的人物一起体验重建世界的新方式。沃尔顿希望可以获得更多出版商的授权,将他们出版的内容开发成这种交互式游戏,让玩家在他们喜欢的场景里展开无限的冒险行动。
 
  有不少作者加入到《AI地牢》游戏的文本创作中,如有的作者用《AI地牢》的游戏界面写了一部冒险小说,还有的作者使用DL算法推进创作中的剧情发展。

[时间:2020-11-16  来源:中国出版传媒商报]

黄品青微站