关键词的提取对信息检索的影响(信息检索技术---截词检索)

截词检索是防止漏检,提高查全率的一种检索技术,用于外文数据库。算符为*或?。其功能相当于布尔逻辑“”。

截词实际是截字母。在检索词的适当位置进行截断,防止漏检节省输入的字符。网络数据库主要用的是无限后截词

截词的方式与类型如下。

(1)自动截词

自动截词由数据库自动取词或截词。

(2)人工截词

人工截词按截词位置分为以下几种。

①前截词:*install(install、uninstall);

②中截词:sul*ate(sulfate、sulphate);

③后截词:treat*(treat、treated、treating、treatment)。

人工截词按截词数量分为以下几种。

①有限截词:book?? ( bookbooks ) acid?? (acidacidsacidic);

②无限截词:treat?(treat、treated、treating、treatment)。

后截词是一种满足前方一致的检索,用于名词的单、复数和动词词尾变化。例如,book*可检索出book和books两个词;treat*可检出treat、treated、treating、treatment这4个词。

其作用相当于布尔逻辑“或”。

关键词的提取对信息检索的影响(信息检索技术---截词检索)(1)

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页