博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hanlp提取文本关键词的使用方法记录
阅读量:7048 次
发布时间:2019-06-28

本文共 709 字,大约阅读时间需要 2 分钟。

本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下!

如何在一段文本之中提取出相应的关键词呢? 之前有想过用机器学习的方法来进行词法分析,但是在项目中测试时正确率不够。于是这时候便有了 HanLP-汉语言处理包 来进行提取关键词的想法。

   下载:.jar .properties data等文件

请到大快搜索官网下载 HanLP新版本,1.7.1数据包下载gitub上也可以下载

   在intellij中配置环境,并运行第一个demo

在项目中配置jar包,添加依赖。

file->Project Structure->Modules->Dependencies->+Jars

e6283e6f36dd910c3518640e8d03b7d9090edb96 

将properties文件转移到src根目录下,修改root为自己的数据集路径

 

63d15f77a64a441666252c8d392f9cea27f5b420

  运行第一个demo

 

1 public class TestHanLP {

2    public static void main(String[] args) {

3        System.out.println(HanLP.segment("你好,欢迎使用HanLP!"));

4    }

5 }

 

可能的错误

 

字符类型对应表加载失败:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes

 

解决办法:查看错误提示页面下是否有该文件,如果没有则去网上下载一个。像我这里,由于只是使用其一部分功能,为了方便就不再下载了,这里我直接修改了一个文件的文件名—–成功运行!。

 

55b88f35c8ee55ccb671c637f630e90138cc537d

成功运行

b7af59a3f95c8cbcaaaa15d78360ba17250eabce

 

 

转载地址:http://rpkol.baihongyu.com/

你可能感兴趣的文章
PostgreSQL 10.0 preview 功能增强 - slave提前苏醒
查看>>
技术流乱入拜年帖 - 小鸡吉吉和小象(PostgreSQL)Pi吉的鸡年传奇
查看>>
保证数据一致性的常见做法
查看>>
用POSTFIX,DOVECOT,OPENWEBMAIL集成在CENTOS上
查看>>
View绘制原理——怎么画?
查看>>
HTTP/1.x 及 Service Worker 缓存实践小结
查看>>
NLP系列学习:潜在语义牵引
查看>>
CSS的堆叠上下文
查看>>
窥探小程序的秘密 个人小程序申请
查看>>
首个稳定更新版 —— Flutter 1.2 发布
查看>>
解:webdriver 实例 IE8报错: Protected Mode must be se...
查看>>
运维之我的docker-部署私有仓库Registry
查看>>
ACCP学习旅程之-----使用C#开发数据库应用程序(第五章 用控件进行快速开发)
查看>>
Vim入门基础
查看>>
用tail同时查看多个文件的日志输出
查看>>
如何使用vmware虚拟机上网
查看>>
linux普通用户获取管理员权限
查看>>
laravel中自定义日志目录
查看>>
centos5下安装配置oracle数据库
查看>>
Java面试 机试题01
查看>>