大规模中文自然语言处理语料 Large Scale Chinese Corpus for NLP
Chinese voice corpus. 中文语音语料,语音更加清晰自然,包含8个开源数据集...
开源SFT数据集整理,随时补充
PTT 八卦版問答中文語料
汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。
Pretrained model for Chinese Scientific Text