Chinese Word2vec Pytorch Save

word2vec implementation for skip-gram in pytorch

Project README

word2vec implementation for skip-gram in pytorch

本repo包含了使用pytorch实现skip-gram版本的word2vec词向量模型。

备注: 该版本以batch为1进行训练，速度较慢。

目录结构

主要的代码目录结果如下所示:

├── pyword2vec
|  └── callback
|  |  └── lrscheduler.py　　
|  └── config
|  |  └── word2vec_config.py　　
|  └── dataset　　　　　　　　　　　
|  └── io　　　　　　　　　　　　　　
|  └── model
|  └── output　　　　　　　　　　　
|  └── preprocessing　　　　
|  └── train
|  └── utils
├── get_similar_words.py
├── train_gensim_word2vec.py
├── train_word2vec.py

案例

首先下载数据集，可以从百度网盘{提取码：7fyf},并放入pyw2v/dataset/raw文件夹中
修改config文件夹中对应的数据路径配置
运行python train_word2vec.py进行word2vec模型训练

实验结果

大概6次epochs之后，可得到以下结果:

目标词	Top10	目标词	Top10
中国	中国 : 1.000	男人	男人 : 1.000
中国	美国 : 0.651	男人	女人 : 0.764
中国	日本 : 0.578	男人	女生 : 0.687
中国	国家 : 0.560	男人	男生 : 0.670
中国	发展 : 0.550	男人	喜欢 : 0.625
中国	文化 : 0.529	男人	恋爱 : 0.601
中国	朝鲜 : 0.512	男人	岁 : 0.590
中国	经济 : 0.504	男人	女 : 0.588
中国	世界 : 0.493	男人	感觉 : 0.586
中国	社会 : 0.481	男人	男朋友 : 0.581

Open Source Agenda is not affiliated with "Chinese Word2vec Pytorch" Project. README Source: lonePatient/chinese-word2vec-pytorch

Stars

Open Issues

Last Commit

4 years ago

Repository

lonePatient/chinese-word2vec-pytorch

Open Source Agenda Badge

<a href="https://www.opensourceagenda.com/projects/chinese-word2vec-pytorch"><img src="https://www.opensourceagenda.com/projects/chinese-word2vec-pytorch/reviews/badge.svg" alt="Open Source Agenda"></a>

Submit Review Review Your Favorite Project

Submit Resource Articles, Courses, Videos

Submit Article Submit a post to our blog

From the blog

Dec 11, 2022

How to Choose Which Programming Language to Learn First?

From the blog

Dec 11, 2022