DNN CWS Save

利用深度学习实现中文分词

Project README

基于深度学习的中文分词

使用TensorFlow实现基于深度学习的中文分词

本项目使用python3编写，没有支持python2的计划。

注：本项目主要是为了进行中文分词等相关自然语言处理研究而创建，暂时不推荐在正式的生产环境使用，另外本项目目前还在开发阶段

使用方法

准备

安装tensorflow：

pip install tensorflow

clone本项目至本地.
运行文件init.py，生成训练用数据

开始使用

在本项目文件夹下创建一个文件，在里面添加如下代码并运行：

from seg_dnn import SegDNN
import constant

cws = SegDNN(constant.VOCAB_SIZE,50,constant.DNN_SKIP_WINDOW)
print(cws.seg('我爱北京天安门')[0])

详细示例可见文件test.py

参考论文：

deep learning for chinese word segmentation and pos tagging （已完全实现，文件seg_dnn.py）
Long Short-Term Memory Neural Networks for Chinese Word Segmentation (基本实现，正在改进，文件seg_lstm.py)
Max-Margin Tensor Neural Network for Chinese Word Segmentation （正在实现，文件seg_mmtnn.py）

Todo List

支持pip
添加更加详细的注释
提供词性标注功能

Open Source Agenda is not affiliated with "DNN CWS" Project. README Source: supercoderhawk/DNN_CWS

Stars

Open Issues

Last Commit

6 years ago

Repository

supercoderhawk/DNN_CWS

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/dnn-cws"><img src="https://www.opensourceagenda.com/projects/dnn-cws/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022

DNN CWS Save

基于深度学习的中文分词

使用方法

准备

开始使用

相关代码文件说明

参考论文：

Todo List

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?

From the blog

How to Choose Which Programming Language to Learn First?