pythonpulp怎么使用(pyhanlp安装介绍和简单应用)
pythonpulp怎么使用
pyhanlp安装介绍和简单应用1. 前言
中文分词≠自然语言处理!
hanlp
hanlp是由一系列模型与算法组成的java工具包,目标是普及自然语言处理在生产环境中的应用。hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁
中文分词只是第一步;hanlp从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的api。
不同于一些简陋的分词类库,hanlp精心优化了内部数据结构和io接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120mb。无论是移动设备还是大型集群,都能获得良好的体验。
不同于市面上的商业工具,hanlp提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。
hanlp希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。
我们使用的pyhanlp是用python包装了hanlp的java接口。
2. pyhanlp的安装和使用
2.1 python下安装pyhanlp
pip安装
|
sudo pip3 install pyhanlp |
第一次import pyhanlp会下载一个比较大的数据集,需要耐心等待下,后面再import就不会有了。
|
from pyhanlp import * |
详情请见pyhanlp官方文档
2.2 pyhanlp简单使用方法
分词使用
|
from pyhanlp import * print (hanlp.segment( "今天开心了吗?" )) >>> [今天 / t, 开心 / a, 了 / ule, 吗 / y, ? / w] |
依存分析使用
|
from pyhanlp import * print (hanlp.parsedependency( "今天开心了吗?" )) >>> 1 今天 今天 nt t _ 2 状中结构 _ _ >>> 2 开心 开心 a a _ 0 核心关系 _ _ >>> 3 了 了 e y _ 2 右附加关系 _ _ >>> 4 吗 吗 e y _ 2 右附加关系 _ _ >>> 5 ? ? wp w _ 2 标点符号 _ _ |
2.3 pyhanlp可视化
如果大家看不太清楚上面的输出,pyhanlp提供了一个很好的展示交付界面,只要一句命令就能启动一个web服务
|
hanlp serve |
登录http://localhost:8765就能看下可视化界面,能看到分词结果和依存关系的结果,是不是很直观。这个网页上还有安装说明、源码链接、文档链接、常见的问题(faq)。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持开心学习网。
原文链接:https://www.cnblogs.com/huangyc/p/10279247.html
- kafka 单机安装(在Linux环境下安装Kafka)
- dockerfile 添加yum文件(使用YUM 安装 docker的方法步骤)
- phpstudyv8.0使用教程学习(phpStudy环境安装SSL证书教程)
- 如何用xampp新建数据库(Windows系统下XAMPP的安装配置图文教程)
- mysql安装时服务无法启动(MySQL 实例无法启动的问题分析及解决)
- docker redis安装配置(在docker中部署并启动redis的方法)
- sql数据库安装概要(详解将DataGrip连接到MS SQL Server的方法)
- h5实现唤起本地app(h5页面唤起app如果没安装就跳转下载iOS和Android)
- sas编程如何加标签(sassscss的安装与使用教程)
- 织梦安装程序(windowsxp下织梦后台如何安装)
- win7安装安卓模拟器(腾讯云服务器怎么安装安卓模拟器 可以安装安卓模拟器吗)
- pythonpil安装包(基于Python的PIL库学习详解)
- docker启动失败容器目录结构(docker容器中安装vim问题解决)
- vsftpd服务器的安装与配置(编译安装 vsFTP 3.0.3的详细解析)
- kubernetes 虚拟机安装(VirtualBox+Ubuntu16搭建Kubernetes集群的实现)
- python3.7.2 详细安装教程(python3.5安装python3-tk详解)
- 辱华品牌新百伦官宣新代言人IU,个别粉丝希望get爱豆同款(辱华品牌新百伦官宣新代言人IU)
- 巅峰时期被爆床照,曾被选国民最讨厌女星,IU不为人知的黑历史(巅峰时期被爆床照)
- 每天1万吨牛奶倒进下水道,美国大萧条一幕重现(每天1万吨牛奶倒进下水道)
- 如何看待美国数十万加仑牛奶倒下水道 历史又重演了(如何看待美国数十万加仑牛奶倒下水道)
- 历史惊人的相似,美国80万加仑牛奶倒入下水道,意味着什么(历史惊人的相似)
- 美国数十万加仑牛奶倒进下水道,世界会重演1929年的大萧条吗(美国数十万加仑牛奶倒进下水道)
热门推荐
- 云服务器模式有哪些(私人云服务器用途有哪些?私人云服务器可以做什么?)
- python入门知识点总结(深入解析Python小白学习操作列表)
- js和css哪个重要(js与css的阻塞问题详析)
- phpmyadmin 安装教程(新安装的XAMPP访问phpmyadmin出错的解决方法)
- mysql8.0.12安装教程图解(mysql 8.0.22 zip压缩包版免安装下载、安装配置步骤详解)
- phpmysql怎么搭建(PHP使用PDO、mysqli扩展实现与数据库交互操作详解)
- 免费国外云服务器有哪些?(免费国外云服务器有哪些?)
- sqlserver 空间数据类型(SQL Server数据类型转换方法)
- mysql表结构设计分享(MySql开发之自动同步表结构)
- $(document).ready和window.onload的区别
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9