当前位置: 首页 > >

面向移动终端的微博信息推荐方法ppt

发布时间:

面向移动终端的微博信息推荐方法
赵方瑜

宋双永 李秋丹 《计算机科学》第38卷第11期 2011年11月

背景
? 微博在移动终端的发展快 ? 移动设备存在显示不处理上的有限性,使用户无 法方便快速了解微博热点

“好友推荐”与“主题扩展”

好友 推荐
Weng Grosseck和Holotescu Sakaki 应用

WhoshouldiF0llow

WeFollow 主题 扩展

基于相关主题模型的移动微博信息推荐
LDA(Latent Dirichlet Allocation) 主题模型 CTM (correlated topic model) 整体概括信息

均值向量 主题服从Logistic正 态分布

每对隐含主题的 相对强弱

协方差矩阵

每对隐含主题的 关联程度

CTM模型(用户-主题-词语)
隐含主题在每 个词上的份额 描 述 隐 含 主 题 间 相 对 强 弱 目标用户特 征词向量 隐含主题概率

用户层参数

词层

用户层

隐含主题抽取 数目

词层-用户层-信息集合层

user-word矩阵 topic-word矩阵 topic-user矩阵

topic-topic矩阵

输人:User-word矩阵;待抽取的主题个数T;EM的收敛阈 值 ; 迭代过程的摄大循环次数M 。 输出:Topic-word矩阵;Topic-user矩阵;Topic-topic矩阵。

算法:
? 步骤一:估计CTM模型的参数 ? 步骤二:利用隐含变量的迭代结果,计算目标文 档的生成概率值 ? 步骤三:利用詹森丌等式计算得到结果的EM 值。 ? 步骤四:若EM< ,停止迭代。 ? 步骤五:通过生成的Topic-word矩阵,总结每个 主题所包含的内容;从Topic-user矩阵中排序每 个主题下的相关用户;以Topic-topic矩阵为基础, 发现主题之间的关联关系。

实验
1.数据来源:Friendfeed了从2009—09—01到200909-30期间由111284位不同用户所发表的1641531条 帖子内容 2.数据预处理(最终数据61934个用户、29895个词语)
50(主题数目)

3.参数设定

10-3 (EM的阈值)

1000(迭代过程中最大循环次数) 0.35(主题关联与否的阈值)

主题关联性评价标准——λ

0<λ<1

微博信息系统推荐范例
利用J2ME技术,将 信息进行整合,将 信息浏览变得简便。

系统界面

主题抽取结果

通过追随用户 实现微博信息 关注

结论 本文基于微型博客的交互性环境,通过基 于主题模型的好友推荐和主题扩展的方法, 提高了用户浏览的便捷性及主题抽取的准 确性。




友情链接: