关键词的提取对信息检索的影响(信息检索技术---截词检索)
截词检索是防止漏检,提高查全率的一种检索技术,用于外文数据库。算符为*或?。其功能相当于布尔逻辑“或”。
截词实际是截字母。在检索词的适当位置进行截断,防止漏检、节省输入的字符。网络数据库主要用的是无限后截词。
截词的方式与类型如下。
(1)自动截词
自动截词由数据库自动取词或截词。
(2)人工截词
人工截词按截词位置分为以下几种。
①前截词:*install(install、uninstall);
②中截词:sul*ate(sulfate、sulphate);
③后截词:treat*(treat、treated、treating、treatment)。
人工截词按截词数量分为以下几种。
①有限截词:book?? ( bookbooks ) acid?? (acidacidsacidic);
②无限截词:treat?(treat、treated、treating、treatment)。
后截词是一种满足前方一致的检索,用于名词的单、复数和动词词尾变化。例如,book*可检索出book和books两个词;treat*可检出treat、treated、treating、treatment这4个词。
其作用相当于布尔逻辑“或”。
免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com