sci论文常用数据集(材料类SCI论文的用词)
本文内容来源于《破解SCI 论文写作奥秘》,我来为大家科普一下关于sci论文常用数据集?下面希望有你要的答案,我们一起来看看吧!
sci论文常用数据集
本文内容来源于《破解SCI 论文写作奥秘》。
文中,作者将大数据与SCI 论文进行有机结合,通过自然语言处理技术,得到SCI论文的各部分的用词频率统计情况,以期对材料类科研工作者的SCI 论文写作提供一定的帮助。
具体的处理步骤如下:
(1)将PDF格式的论文转换为txt格式;
(2)去除噪声信息(如论文页面边角信息、页眉、引文等);
(3)文献按 Introduction、 Experiment、 Results and discussion、 Conclusions 分块;
(4)自然语言处理技术进行处理;
(5)标注词性及去除错误;
(6)得到词频统计情况。
---------------------------------------------------------------------
Experiments 部分
---------------------------------------------------------------------
(1)过去分词(高频词 频次)
shown 235 observed 162 obtained 97
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com