作业帮直播课的存储权限(作业帮数据处理实践)
在日常生活中,我们总是免不了与各行各业的客服人员交流,有时对于其推广的服务,我们欣然接受;而有时是真的不需要;当然,偶尔也会出现实则需要,但因其产品功能等达不到自己的要求而拒绝。过往,用户的需求都是通过人工来留存处理,但这样对企业来说,效率低且成本高,有没有可能借助更高效的技术来对用户需求进行自动归纳与处理?
答案是:必须有!
近日,作业帮公开了发明专利“一种挖掘用户需求的数据处理方法、装置及电子设备”,可以通过对用户需求的大概定位,通过聚类分析提高备选语句的质量和浓度,利用核心词权重在每个分类内排序,提高后续归纳工作的效率和效果,使用户需求的挖掘更加系统化。
专利摘要显示:本发明属于数据信息处理技术领域,特别适用于在线服务中的数据信息处理,更具体的是涉及一种挖掘用户需求的数据处理方法、装置及电子设备。 方法包括:
- 定位用户对话内容中表达否定意愿的语句,以该语句为中心进行对话内容的扩展;
- 对扩展后的对话内容进行聚类分析,确定每个分类中的核心词的权重;
- 基于核心词的权重确定各个分类的主题,即用户需求。
其中,提到使用聚类分析模型对短句进行聚类分析,所述聚类分析模型采用Biterm Topic Model算法。
Biterm Topic Model (BTM)是一个基于单词共现的主题模型,它通过建模单词共现模式(比如 biterms)来学习主题。
在作业帮此专利中,提到“聚类分析模型在对短句进行聚类过程中,Biterm Topic Model 算法会对每个分类中包含的单词计算在该分类下的权重。基于核心词的权重确定各个分类的主题,即用户需求。”
其实,在Biterm Topic Model的应用目前已不鲜见,比如有国外相关领域研究者采用这种方法来识别推文的主题等。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com