注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

数据挖掘

学习数据挖掘

 
 
 

日志

 
 

A TRICK OF DOING SVD ON BINARY DATA  

2013-04-08 21:14:19|  分类: 推荐系统 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
原文连接: http://xlvector.net/blog/?p=465

原文中给出了如何设置二值的user_item矩阵,便于使用SVD方法。

I do research on binarySVD for a long time, and today I find by changing value 0 in binary user-item matrix, we can get more accurate recommendation.

In binary data, user-item matrix R are defined as:
R(u, i) = 1 if user u like item i
R(u, i) = 0 missing value

if we let R(u, i) = e if R(u, i) = 0, where e is a positive number less than 1, and then used classical SVD to factorize R, we can produce very accurate recommendation.

Another result we find is that, for sparse dataset, we shoud choose small e, for example e = 0.2, 

对于稀疏矩阵 和非稀疏矩阵 分别设置不同的数值。


and for dense dataset, we should choose large e, for example e = 0.8. So, the best chose of e depend on the sparsity of dataset.


另:
item/user是一个对稀疏性和多样性描述的不错的指标。item/user 小的系统一般比较稠密,多样性比较差。item/user大的系统一般比较稀疏,多样性比较好。
  评论这张
 
阅读(141)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017