Clinical NER Save

面向中文电子病历的命名实体识别

Project README

运行流程：

@Author zhoukaiyin

任务描述

本评测任务为面向中文电子病历的命名实体识别，即对于给定的一组电子病历纯文本文档，任务的目标是识别并抽取出与医学临床相关的实体提及（entity mention），并将它们归类到预先定义好的类别（pre-defined categories），比如症状，药品，手术等。

第一步：数据处理(Linux)

$python raw2bio.py -1 #将训练数据分词并贴上字典特征

$python raw2bio.py -2 #将标签数据分词并贴上标签

$python raw2bio.py -3 #将标签保存成pickle文件为了后面将训练数据与标签合在一起

$python raw2bio.py -4 #将标签与训练数据文本接起来构成如下格式

$python raw2bio.py -1 test #将测试数据处理成需要的格式

第二部：模型训练(Linux)

$bash wapiti_ccks.sh #训练模型，模型储存在/eval/bio_ccks中

第三部分：获得结果(Linux)

$python get_result.py #提取结果文件，结果保存在CCKS_result中其格式为BIO和finall中格式为官方标签格式

$python onefile.py #将结果转成提交格式

结果文件

Flyon\CCKS_CRF\eval\result.txt

Wapiti is a simple and fast discriminative sequence labeling toolkit ( http://wapiti.limsi.fr )。A little same as CRF++

注：可以尝试BERT,ALBERT等预训练模型参见：NLPGNN

Open Source Agenda is not affiliated with "Clinical NER" Project. README Source: kyzhouhzau/Clinical-NER

Stars

182

Open Issues

Last Commit

4 years ago

Repository

kyzhouhzau/Clinical-NER

License

Apache-2.0

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/clinical-ner"><img src="https://www.opensourceagenda.com/projects/clinical-ner/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022

Clinical NER Save

运行流程：

@Author zhoukaiyin

任务描述

第一步：数据处理(Linux)

$python raw2bio.py -1 #将训练数据分词并贴上字典特征

$python raw2bio.py -2 #将标签数据分词并贴上标签

$python raw2bio.py -3 #将标签保存成pickle文件为了后面将训练数据与标签合在一起

$python raw2bio.py -4 #将标签与训练数据文本接起来构成如下格式

$python raw2bio.py -1 test #将测试数据处理成需要的格式

第二部：模型训练(Linux)

$bash wapiti_ccks.sh #训练模型，模型储存在/eval/bio_ccks中

第三部分：获得结果(Linux)

$python get_result.py #提取结果文件，结果保存在CCKS_result中其格式为BIO和finall中格式为官方标签格式

$python onefile.py #将结果转成提交格式

结果文件

Wapiti is a simple and fast discriminative sequence labeling toolkit ( http://wapiti.limsi.fr )。A little same as CRF++

注：可以尝试BERT,ALBERT等预训练模型 参见：NLPGNN

Open Source Agenda Badge

From the blog

How to Choose Which Programming Language to Learn First?

From the blog

How to Choose Which Programming Language to Learn First?

注：可以尝试BERT,ALBERT等预训练模型参见：NLPGNN