中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
接下来是一个全新的时代,我们的征途是星辰大海。此后1.x分支将继续提供稳定性维护,两个版本面向的场景不同,2.0基于深度学习,面向对精度要求极其高的场景,例如端到端的问答系统解决方案;而1.x基于传统机器学习和特征工程,面向搜索引擎等对速度要求较高的场景。2.0需要时间打磨,1.x将会持续维护,保证稳定性。
md5=1d9e1be4378b2dbc635858d9c3517aaa
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.6</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
一本零起点NLP入门书,基础理论与生产代码并重,Python与Java双实现。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。《自然语言处理入门》由南方科技大学数学系创系主任夏志宏、微软亚洲研究院副院长周明、字节跳动人工智能实验室总监李航、华为诺亚方舟实验室语音语义首席科学家刘群、小米人工智能实验室主任兼NLP首席科学家王斌、中国科学院自动化研究所研究员宗成庆、清华大学副教授刘知远、北京理工大学副教授张华平和52nlp作序推荐。感谢各位前辈老师,希望这个项目和这本书能成为大家工程和学习上的“蝴蝶效应”,帮助大家在NLP之路上蜕变成蝶。
md5=1d9e1be4378b2dbc635858d9c3517aaa
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.5</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
md5=0e2e1bfc4da6d9305909ce815cbe5a44
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.4</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
md5=4e4f3695565a75b56427ba4a40731949
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.3</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
md5=2228732bae47b8dc8e410678af72847f
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.2</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
MD5 = 9b8faa7fc7fddb24e27da27bd404126d
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.1</version>
</dependency>
感谢所有在issue中提出宝贵建议的用户!
enableRuleBasedSegment
https://github.com/hankcs/HanLP/issues/991
java -DHANLP_ROOT=/opt/hanlp
则加载/opt/hanlp/data
https://github.com/hankcs/HanLP/issues/983
CustomDictionary.insert("新词语", "词性标签")
支持省略频次NeuralNetworkDependencyParser
构造函数接受Segment
TextRankKeyword
支持构造自任意分词器MD5 = 4c396f3039230ddfcef20865264512b1
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.7.0</version>
</dependency>
:tada:节日快乐!感谢所有在issue中提出宝贵建议的用户!
NLPTokenizer.analyze
接口或PerceptronLexicalAnalyzer
体验这一改进。HMMSegment
md5=0eae09571f080bd99b81f79bee6c6b62
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.8</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
md5=4da338b7bcf3939a70b8cc16ed338c45
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.7</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!
CRFSegmentModel.txt.bin
md5=aea7194670d89f920d59a592568c88ad
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.6.6</version>
</dependency>
:tada:感谢所有在issue中提出宝贵建议的用户!