ai学习心得和总结(知识支撑的信息检索与推荐)
摘 要
本文介绍了目前国内外关于知识支撑的信息检索与推荐的研究进展,主要针对结合知识图谱的信息检索与推荐方法,以及知识支撑的搜索用户行为分析两个主要的研究方向进行了梳理和分析,并对未来工作提出了展望。
关 键 字
信息检索;推荐系统;知识图谱;探索式搜索
0 引言
知识和信息,是两个联系紧密而又有所区别的概念。信息科学领域的 DIKW 体系(DataInformation-Knowledge-Wisdom pyramid)能很好地阐释它们之间的关系。如图 1 所示,DIKW 体系是一个金字塔,从下往上包含数据(data)、信 息 (information)、 知 识(knowledge) 和智慧(wisdom)四个组成部分。其中,数据是信息的基础;信息是知识的基础;知识是智慧的基础。经过一定组织和处理,使其与当前的上下文或者任务相关,因此具有一定的意义、价值和相关性,并对完成当前任务有用,数据就可以被称为信息。当信息被进一步结构化,与其他信息建立联系,或者被吸收和整合现有的知识体系和结构中去,以帮助人们完成当前或未来的任务,信息就被转化为了知识。
图 1 DIKW 体系
传统信息检索研究主要涉及对非结构化或半结构化的海量数据进行存储、组织、索引和检索,使用户能快捷有效地从中检索和获取相关的信息。即主要涉及如何帮助用户从数据中获取信息。然而随着信息检索研究的不断发展,研究者开始逐渐意识到在信息检索领域中引入知识的重要性。
一方面,从系统的角度,研究者开始意识到,在传统的文本数据和用户行为数据之外,我们可以利用知识图谱等高质量的结构化知识,进一步改进搜索引擎和推荐系统的排序性能。另一方面,从用户的角度,研究者开始将搜索过程看作是用户学习和获取知识的过程,从这一角度对用户的搜索行为进行分析、理解和建模。因此,本文将从上述两个方面,介绍知识支撑的信息检索与推荐相关研究进展。
1 结合知识图谱的信息检索与推荐方法
在信息检索领域,搜索引擎和推荐系统是两个最重要的应用方向。目前已有大量研究工作从不同方面尝试改进搜索排序和推荐排序的效果,包括利用用户的各类交互行为(点击和浏览等)和待排序条目的内容信息(描述和关键词等),也已在不同场景提升了算法表现。随着近些年相关研究的逐渐深入,越来越多的研究者开始意识到,信息检索场景之外的结构化知识对进一步改进搜索和推荐算法有重要作用,这些结构化知识能帮助我们更好地刻画搜索和推荐场景中的待排序条目。
具体来说,知识图谱中包含了大量的实体和实体间的联系信息,这两类信息都对信息检索系统中的待排序内容的表示有重要帮助。一方面,如果将待排序内容(如搜索引擎中的文档或推荐系统中的商品等)与知识图谱中实体进行链接匹配,我们将能找出待排序内容的关键信息(即包含的实体词);另一方面,实体之间的特殊关系能协助做推理扩散,不管是对搜索场景下查询词的扩展还是推荐场景下待推荐内容的关系发现都将有重要作用。
近年来,在搜索引擎和推荐系统领域有不少工作已基于类似思路开始了研究。已有学者在搜索场景下尝试在传统查询词-文档内容匹配的基础上借助知识图谱,考虑查询词中包含的实体与文档包含的实体之间的关联关系情况,进一步改进了文档排序的效果;在推荐系统场景中,由于知识信息的引入还能帮助缓解推荐的可解释性问题,因此有不少研究工作从这一角度入手,提升推荐算法表现的同时改进结果的可解释性。相关研究的应用于场景包括在网页搜索、信息流推荐、商品推荐和电影推荐等场景。可以看到,知识增强的信息检索方法研究已成为近年来研究的热点与重点。下面将对两个场景的知识利用分别做具体介绍。
(1)搜索场景下的知识图谱利用
在搜索排序算法中,查询词与文档的内容及语义匹配情况不管是在传统的 BM25、TF-IDF 算法和最近的深度排序模型中都起到了重要作用。然而,这些算法在进行匹配时大都赋予查询词中的每个词语以同等权重,没有将更多注意力放在关键信息上。例如,当查询词为“奥巴马的亲属关系”时,用户更关注的是“奥巴马”和“亲属”,而不是“关系”这个词语。为了解决这一问题,近年来,卡内基梅隆大学熊辰炎与清华大学刘知远等提出,可以在现有词语匹配的基础上,引入知识图谱中实体词对查询词和文档中包含的实体词同样进行匹配和相似度计算,以实现对关键实体信息的有效利用和挖掘。更进一步地,他们还考虑了词语和实体词的交叉匹配,即考虑了:① 查询词中词语 - 文档中词语;② 查询词中实体词 - 文档中词语;③ 查询词中词语 - 文档中实体词;④ 查询词中实体词 - 文档中实体词,四个维度的语义匹配情况。然后再使用池化和全连接操作得到最终的排序评分。该算法被命名为 EDRM(Entity-Duet Neural Ranking),框架如图 2 所示。
图 2 EDRM 算法模型图
在实验过程中,使用 DBPedia 作为额外引入的知识图谱的 EDRM 算法被应用在大规模中文搜索日志数据集上。结果显示,该算法较基准算法在 NDCG@1 上取得了近 20% 的提升。该结果表明,关键实体信息的引入对于改进搜索排序方法起到了重要作用。
(2)推荐场景下的知识图谱利用
在推荐场景中,我们注意到待推荐条目可能存在一些特定的关系,例如,特别是在商品推荐场景下,不同商品间存在互补(手机和手机壳)、替代(华为手机和苹果手机)等关系。如果能考虑商品之间的这些关系,我们将可以根据用户的历史行为进一步优化待推荐内容,为用户推荐与历史购买有互补关系的商品,同时避免推荐有替代关系的商品。然而,要获取商品间的关系并不容易,商品数量过于庞大导致不可能通过人工标注的方法获取。考虑到知识图谱中包含着大量的现有知识,这些现有知识可能对挖掘和推理商品间的关系有一定帮助。因此,我们基于商品间的关系(如替代和互补),提出了一种新的联合优化框架,用于从知识图谱中学习到归纳规则,并基于归纳规则生成商品对之间的关联特征,将其应用在推荐算法中。该算法框架被命名RuleRec,框架图见图3。
图 3 RuleRec 算法框架图
该模型主要包含规则学习模块和推荐模块两个部分。在规则学习模块中,我们通过在知识图谱上进行随机游走,找到对于商品间的替代关系和互补关系有较好预测作用的规则特征(限定了两个节点间随机游走经过的边的类型序列)。通过这些规则能为每个商品对建模学习到它们的相关性紧密程度,进而可以扩展到单个商品与用户之前购买的商品序列的联系情况。在推荐模块中,我们将学习得到的规则特征进行加权后,与其他推荐算法得到的推荐概率相加,以得到新的推荐概率,并依此生成推荐结果。由于该模型具有很好的耦合性,因此可以与现有的推荐算法有效地结合到一起。在实验过程中,我们使用了 Amazon 的手机和电子产品购物历史数据作为用户和商品的消费记录,并将它们链接到了 Freebase 知识图谱上(最大的开源知识图谱数据集)。最终,我们提出的算法较已有的最好算法在 Recall@5 上取得了平均4.4% 的提升。实验说明,图谱中的知识信息能帮助改进推荐排序算法。除了能提升推荐系统的算法表现,推荐结果的可解释性也是相关研究关注的重点问题之一。在本场景下,知识信息的引入所生成的规则就是天然的用户能直接阅读的推荐解释,通过人工标注我们也发现 94% 的推荐解释能被用户接受。这是说明知识图谱的引入还可以用于提高推荐算法的可解释性。从这些研究可以看到,知识图谱的引入能有效帮助刻画信息检索场景下的待排序内容,同时还提升了相应算法的可解释性。外部的知识的引入为相关领域的研究带来了新的方向和更多可能。
2 知识支撑的搜索用户行为分析
随着搜索技术的发展和广泛应用,搜索引擎在帮助用户高效检索和获取信息的基础上,进一步成为了人类学习和获取知识不可或缺的工具。然而,与通过使用搜索引擎检索和获取较为具体的信息(例如查询明天的天气预报)不同,进行搜索获取知识(例如理解搜索引擎的工作原理)是一个更为复杂的过程 , 用户往往需要进行多次查询,才能完成相应的学习任务。这一方面是由于知识之间往往存在关联与依赖关系,学习任务具有内在多样性(intrinsic diversity),因此用户需要进行多次查询,获取多方面的信息,构建包含知识间关系的知识体系。另外,在开始进行搜索时,用户常常因对相关领域缺乏了解,而陷入无法组织有效的查询的困境中。因此,用户需要在多次查询迭代的过程中,逐渐探索该领域,进而学习如何组织有效查询,更好地获取构建知识体系所需的相关信息。这种复杂的、高度交互式的搜索过程被概括为探索式搜索(exploratory search)。由于现代搜索引擎已经能较好地满足针对具体信息的检索需求,如何有效地支持探索式搜索已经成为信息检索领域的重要研究方向之一。与此同时,一些学者将搜索过程本身视为一个学习的过程,提出了“搜索即学习”(search as learning)这一概念。通过在搜索与学习过程之间建立类比,一方面可以借助心理学理论和学习理论对用户的搜索行为进行归类、分析、刻画和解释;另一方面可以将知识建模、表示和计算的相关方法,应用于复杂多查询会话的评价和用户意图理解模型等任务中。
在分析用户搜索行为方面,IP&M 杂志主编Jansen 等利用认知学习(cognitive learning)领域的分类方法将搜索任务按照复杂程度分为了记忆(remembering)、理解(understanding)、应用(applying)、分析(analyzing)、评价(evaluating)和创造(creating)六类,并比较和分析了用户在完成这六类搜索任务时的搜索行为。芬兰坦佩雷大学的 Vakkari 将搜索时的学习概念化为“用户知识结构的改变”(changes in one’s knowledge structure)并提出可以用概念和其之间的关系来表示用户的知识结构。进一步的,Vakkari 基 于知识结构的变化方式,将搜索过程划分为三个阶段。在第一个阶段里,用户会对知识结构进行重构(restructuring),即改变和替换原有知识结构中包含的概念和关系。相应的用户在这一阶段里会使用较为宽泛的查询词进行检索,会从搜索结果中学习到新的查询词,会更多地阅读与问题背景相关的文档。在第二阶段里,用户会对知识结构进行调整(tuning), 即不替换和修改已有概念和关系,而只是调整它们的范围和含义。在这个阶段里,用户会使用相对更长更具体的查询,并且会建立起较为明确的相关性判断准则(relevance criteria)。在第三阶段里,用户会对知识结构进行同化(assimilation),即获取和知识结构中已有概念相关的实例信息和事实类信息。在这个阶段,用户的查询会变得更加具体,会获取大量的具体的事实类信息,并且会重新检查一些之前忽视的信息来源。
如果将搜索看作是一个学习的过程,除了搜索任务的类型和当前所处的搜索阶段,用户自身具有的领域知识水平(domain expertise)也将会影响不同用户在完成同一个搜索任务时的行为。为了研究用户领域知识水平对其搜索行为和搜索结果的影响,我们组织了一次用户实验。实验中,设置了来自环境、医学、政治学三个领域的六个搜索任务,并从相应的院系招募了 30 个被试参加实验。通过要求每个被试完成两个本领域的搜索任务和四个非本领域搜索任务,我们有效地控制了用户知识水平这一自变量,并系统地分析了自变量对一系列刻画搜索结果和搜索过程的因变量影响。实验结果显示,被试能更好地完成本领域搜索任务,学习到更多的知识并正确回答相关问题,然而,其在完成本领域任务时的搜索满意度并没有显著提升。除此之外,利用眼动仪记录的细粒度用户行为信息,我们发现,用户在完成不熟悉领域的搜索任务时,会更依赖在搜索过程中学到的新查询词,并在阅读搜索结果时花费更多的认知负担(cognitive effort)。
其次,在具体应用方面,由于用户的搜索过程和知识获取及学习过程存在紧密联系,可以利用一系列知识表示方法,对用户在搜索过程中的知识状态变化进行测量与建模,并以此为基础,改进搜索评价和用户意图理解模型。首先,在搜索评价方面,通过将搜索过程看作是一个学习的过程,可以通过评估学习的效果(learning outcome),对用户搜索过程是否有效、成功进行相对客观评价。日本学者 Yuka Egusa 和Noriko Kando 等首先尝试了使用概念图(concept map)对探索式搜索进行评价。概念图最早在教育领域被用于表示学生掌握的科学知识。一个概念图包含若干个概念节点和若干条表示概念之间关系的有向边。Egusa 等在用户实验中要求参与的被试在开始搜索之前和搜索结束后,分别绘制两张与搜索任务主体相关的概念图。通过比较两张概念图,可以计算新增、删除、共有的节点数和边数等指标,用于评价在搜索过程中,用户获取了多少新知识。注意到与传统的搜索满意度评价不同,上述评价方法能测量用户在搜索过程中是否成功地获取了新的知识。我们进一步尝试探究搜索成功程度与搜索满意度之间的联系与差别,以及能否有效地估计和预测搜索成功程度。为了研究上述问题,我们设计和组织了一次用户实验。在实验中每个被试被要求完成六个不同的搜索任务。每个搜索任务包含一道需要用 100 字左右答案回答的简答题。通过对最终答案的正确性进行打分,来测量用户搜索的成功程度;并通过用户的反馈来测量用户的搜索满意度。通过比较搜索成功程度与搜索满意度,发现存在相当比例的搜索会话出现了“满意但失败”和“不满意但成功”的现象。较为客观的搜索成功程度与主观的搜索满意度并不一致。我们进一步将每个任务的正确答案涉及的关键得分点(key point)进行了提取,并对用户在实验过程中阅读过的所有文档进行了细粒度的标注。标注信息包括文档是否包含每个关键得分点,以及文档的相关性、可靠性(credibility)和可读性(readability)。利用文档包含关键得分点和用户的搜索行为信息,分别构建了搜索成功程度评价指标和搜索成果程度预测模型。实验结果表明,利用文档包含知识点的信息,我们能有效地对搜索成功程度这一较为客观的搜索评价指标进行估计。
其次,在用户意图理解方面,我们可以利用知识表示方法对用户在会话中搜索意图的变化进行建模,进而更好地预测用户下一个可能提交的查询,改进搜索引擎的查询推荐功能。例如,来自加州大学洛杉矶分校的 Jiang 和 Wang 将查询日志表示为一个包含不同查询、词项和网站三类型节点的异质网络。该网络中包含四种不同类型的边:① 查询内词项指向下一个词项的边;② 会话内上一查询指向下一查询的边;③ 查询指向包含词项的边;④ 查询指向点击网站的边。基于该异质网络,我们可以使用Node2Vec等表示学习算法,获得网络中节点的嵌入表示,并利用得到的嵌入表示进行查询推荐。查询改写还可进一步分为增加查询词、删除查询词和替换查询词等不同的类别。因此,我们可以将查询作为实体,不同类型的查询改写看作关系,利用TransE 等翻译嵌入模型,得到对应于不同类别查询(不同关系)改写的向量表示。我们在购物搜索的环境下进行了实验。针对购物搜索的特点,构建了一个二级的查询改写分类体系。该分类体系在增、删、改查询词之外,还对修改的查询词是针对设计、商品、风格、品牌、样式、功能、材料、渠道、价格和尺寸 10 类属性中的哪一类进行了区分。结合两级分类,该分类体系共涉及 30 类不同的购物搜索查询改写。通过TransE、TransH 和 TransR 模 型,可以训练得到每个查询词和每一类查询改写的嵌入表示。为了验证得到嵌入表示的有效性,我们设计了一个查询改写类别分类任务,即采用查询改写涉及的前后两个查询的嵌入表示的差作为特征,预测查询改写的类别。实验结果显示,采用翻译嵌入模型得到的向量表示,能有效地预测查询改写的类别。这再一次说明了使用知识表示学习方法,能较为有效地捕捉用户进行查询改写时隐含的搜索意图。
相比于 Xu 等的工作,在模态间隐式对齐的任务上,我们采取了一种反其道而行之的做法。如图 4 所示,从视频图像信息出发,通过注意力机制与时间邻域内的多条文本间建立匹配和对齐。基于这个思想,设计了一种联合图像视觉与用户评论信息的多模态人物重识别模型,并在真实数据集上进行了验证。实验结果证实了模态间的对齐是有效的,使用注意力机制可以在一定程度上识别出那些与视频人物描述更为相关的文本信息,从而有助于更精确地刻画出人物的身份特征,达到更好的人物重识别效果。
3 结束语
由于知识与信息之间存在紧密的联系,在信息检索研究中引入知识的概念,以及知识计算方法是一个值得深入探索的研究方向。从系统的角度出发,可以通过构建模型,引入丰富的外部知识,有效地改进信息检索和推荐模型的排序性能。从用户的角度出发,通过将用户的搜索过程视为一个获取知识的过程,可以加深对用户搜索行为的理解,并借助知识计算方法,改进搜索性能评价和搜索用户意图理解。
选自《中国人工智能学会通讯》
2020年第10卷第9期
知识工程专题
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com