偶然看到了pLSA模型这个东东,不懂,于是找了找资料,这里分享给大家一段代码,帮助理解吧。不好的地方还请多多指教。
2021-10-16 19:03:00 102KB python plsa实现代码
1
pLSA(probabilistic Latent Semantic Analysis),概率潜在语义分析模型,是1999年Hoffman提出的一个被称为第一个能解决一词多义问题的模型,通过在文档与单词之间建立一层主题(Topic),将文档与单词的直接关联转化为文档与主题的关联以及主题与单词的关联。这里采用EM算法进行估计,可能存在差错,望积极批评指正。 # -*- coding: utf-8 -*- import math import random import jieba import codecs import datetime class pLSA_lph(): def __i
2021-05-26 02:47:40 106KB python python函数 topic
1