pythonpulp怎么使用(pyhanlp安装介绍和简单应用)
pythonpulp怎么使用
pyhanlp安装介绍和简单应用1. 前言
中文分词≠自然语言处理!
hanlp
hanlp是由一系列模型与算法组成的java工具包,目标是普及自然语言处理在生产环境中的应用。hanlp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取新词发现 短语提取 自动摘要 文本分类 拼音简繁
中文分词只是第一步;hanlp从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用任务,提供了丰富的api。
不同于一些简陋的分词类库,hanlp精心优化了内部数据结构和io接口,做到了毫秒级的冷启动、千万字符每秒的处理速度,而内存最低仅需120mb。无论是移动设备还是大型集群,都能获得良好的体验。
不同于市面上的商业工具,hanlp提供训练模块,可以在用户的语料上训练模型并替换默认模型,以适应不同的领域。项目主页上提供了详细的文档,以及在一些开源语料上训练的模型。
hanlp希望兼顾学术界的精准与工业界的效率,在两者之间取一个平衡,真正将自然语言处理普及到生产环境中去。
我们使用的pyhanlp是用python包装了hanlp的java接口。
2. pyhanlp的安装和使用
2.1 python下安装pyhanlp
pip安装
|
sudo pip3 install pyhanlp |
第一次import pyhanlp会下载一个比较大的数据集,需要耐心等待下,后面再import就不会有了。
|
from pyhanlp import * |
详情请见pyhanlp官方文档
2.2 pyhanlp简单使用方法
分词使用
|
from pyhanlp import * print (hanlp.segment( "今天开心了吗?" )) >>> [今天 / t, 开心 / a, 了 / ule, 吗 / y, ? / w] |
依存分析使用
|
from pyhanlp import * print (hanlp.parsedependency( "今天开心了吗?" )) >>> 1 今天 今天 nt t _ 2 状中结构 _ _ >>> 2 开心 开心 a a _ 0 核心关系 _ _ >>> 3 了 了 e y _ 2 右附加关系 _ _ >>> 4 吗 吗 e y _ 2 右附加关系 _ _ >>> 5 ? ? wp w _ 2 标点符号 _ _ |
2.3 pyhanlp可视化
如果大家看不太清楚上面的输出,pyhanlp提供了一个很好的展示交付界面,只要一句命令就能启动一个web服务
|
hanlp serve |
登录http://localhost:8765就能看下可视化界面,能看到分词结果和依存关系的结果,是不是很直观。这个网页上还有安装说明、源码链接、文档链接、常见的问题(faq)。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持开心学习网。
原文链接:https://www.cnblogs.com/huangyc/p/10279247.html
- 阿里云服务ecs操作系统(阿里云ECS服务器CentOS7上安装服务器安全狗Linux版)
- 织梦源码安装数据库怎么填(Mysql修改端口号 织梦DedeCMS设置教程)
- mysql安装时服务无法启动(MySQL 实例无法启动的问题分析及解决)
- 宝塔linux面板安装(宝塔Linux控制面板专业版破解步骤亲测可用)
- centos安装sql server(Centos 7.3下SQL Server安装配置方法图文教程)
- python3安装编程环境(Python3 修改默认环境的方法)
- dell r730服务器安装操作系统(DELL R730服务器配置RAID与安装服务器系统以及域的控制详细图文教程)
- pythonpandas使用攻略(详解Python中pandas的安装操作说明傻瓜版)
- kalilinux安装到u盘教程学习(kali安装docker和portainer的配置方法)
- postgresql docker 宿主机(本地Docker安装Postgres 12 + pgadmin的方法 支持Apple M1)
- SQLServer2019安装教程图文详解(SQLServer2019安装教程图文详解)
- centos安装php5.6(Centos7 Yum安装PHP7.2流程教程详解)
- 安装laravel框架(laravel框架的安装与路由实例分析)
- dedecms本地搭建(dedecms blog博客模板安装说明)
- docker compose使用方法(docker和docker-compose一键安装教程支持在线和离线)
- centos7 离线安装nginx(centos8安装nginx1.9.1的详细过程)
- 鱼竿 夏钓短,冬钓长 ,一定是这样 认清优缺点在选竿(鱼竿夏钓短冬钓长)
- 鲢鳙钓底还是钓浮 流水的水域应怎样做钓(鲢鳙钓底还是钓浮)
- 入秋后的第二场苹果发布会来了 全新M1系列芯片登场(入秋后的第二场苹果发布会来了)
- 苹果正式发布自研芯片M1 5nm 32核心 彻底放弃Intel(苹果正式发布自研芯片M1)
- 苹果自研芯片跑分对比 A16芯片排名靠后,M1系列霸榜(苹果自研芯片跑分对比)
- X86处理器的梦魇 苹果M1自研芯片到底有多强(苹果M1自研芯片到底有多强)
热门推荐
- python中迭代器的作用(Python3.5迭代器与生成器用法实例分析)
- dedecms标签使用(DEDECMS 自动缩略图无法生成问题的解决方法)
- mybatis动态sql框架(Mybatis4 之Mybatis动态sql的实现代码)
- python队列快速排序(python按照多个条件排序的方法)
- vue图片组件使用方法(Vue图片裁剪组件实例代码)
- python怎么导入xlsx(用Python将结果保存为xlsx的方法)
- reactmap给了key仍然提示错误(react为什么不推荐使用index作为key)
- teamcenter常见问题(TeamCenter12登陆报404/503问题解决方案)
- php怎么设置统计代码(php简单计算权重的方法示例适合抽奖类应用)
- css3字体怎么设置(使用CSS3 font-feature-settings特性减除字体动画震颤效果)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9