&urnw2indx,w2vec,corpus
else:
print("Nodataprovided。。。")
#定义词向量训练函数
#创建词典,返回词索引、词向量以及每个句子所对应的词语索引
defword2ve(corpus):
program=os。path。basename(sys。argv[0])
l。getLram)
logging。basiat='%(asctime)s:%(levelname)
s:%(message)s')
}bl loggiLevel(level=logging。INFO)
logger。inf%s"%''。jv))
model=Word2Vetence(corpus),
size=vocab_dim,
min__exposures,
_size,
workers=t,
&erations)
#保存词向量模型
model。save('word2vec_model。pkl')
#生成词向量并保存
defcorpus_wv():
print("Loadingcorpus。。。")
corpus=code("语料_sep。txt",eng='utf-8')
print(len(corpus))#载入语料库并显示语料库长度
#调用词向量训练函数,训练词向量
print(&quaWord2vecmodelofcorpus。。。")
word2ve(corpus)
print("Vectorsofcorpusarebuiltsuccessfully。")
#定义主函数
if__name__=='__main__':
corpus_wv()