Deep contextualized word representations for Chinese
Deep contextualized word representations for Chinese.
本仓库只是输出上下文无关的 word embedding。
pre_data/vocab.py
处理出词典(每个 data 文件不能太大,否则内存不够)train_elmo.py
dump_weights.py
options.json
里的 261 改成 262usage_token.py
用可视化工具看合理,textmatch
任务提升 AUC 1-2。
MIT