当前位置: 首页 > 推荐系统 > 正文

推荐系统相关的几个问题

1 星2 星3 星4 星5 星 (1 次投票, 评分: 5.00, 总分: 5)
Loading ... Loading ...
baidu_share

1.推荐的长尾

杨勃发现,推荐光准确是没有用的,还要有效。“我们也做过通过标签分析,这本书和哪本书最像,通过它做推荐,很准,但用处不大。比如你看过《黑客帝国 1》,然后它找出《黑客帝国2》给你,这种推荐毫无用处。你看过余华的《活着》,我把《细雨中的呼喊》(余华的早期作品)推荐给你。这通常也没有用。有效的推荐,是你挖掘出来的联系不是表面能看出来的。比如你看《世界是平的》,豆瓣会推荐《长尾理论》,这两个之间其实没有内容上的联系。”

参考:豆瓣推荐系统的长尾推荐机制

我的理解,比如某用户访问过网址新浪,推荐给此用户的网址不一定非得含有门户的网址(比如搜狐、网易、腾讯),说不定推荐淘宝、京东、4399、一听音乐网给此用户会更喜欢,或者推荐的结果含有更加冷门一点的网站,这样利于发现长尾的数据。

2.啤酒和尿布的故事

关联规则的最典型例子就是购物篮分析。在一家超市里,有一个有趣的现象:尿布和啤酒赫然摆在一起出售。但是这个奇怪的举措却使尿布和啤酒的销量双双增加了。这不是一个笑话,而是发生在美国沃尔玛连锁店超市的真实案例,并一直为商家所津津乐道。原来,美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布。而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和尿布在一起购买的机会还是很多的。这个故事听起来是不是很酷?没错,这就是技术的力量!
参考:推荐系统的关联规则推荐

我的理解:啤酒与尿布从表面来看没有任何关联,但是却使尿布和啤酒的销量能增加,说明物品的摆放比较合理,超市考虑了用户的需求,也就是说,如果将啤酒、白酒、红酒、黄酒摆放在一起,效果不一定有将啤酒与尿布放在一起好。

3.关于下一代推荐系统的一些看法

下面这段话是中科院的项亮写的,写得非常不错。

在中国,我一向最佩服的就是douban的推荐系统,因为他们的推荐系统设计是专业的,而不是只用了简单的方法。据说他们使用了业界的一些先进算法。我用豆瓣很久了,但是他的推荐系统还有问题,当然这个问题不是豆瓣的问题,而是推荐系统中很难解决的一些问题。

我们知道,单纯的collaborative filtering在实际系统中是不够的,我们需要利用内容信息,但是我们在使用内容时往往是简单的用来计算相似度。比如我们有书的作者,出版社,书名, 标签信息。我们往往用这些信息来比较书的相似度,然后推荐相似的书给用户。但是我在研究中发现,用户对书的不同属性的依赖是不同的,有些用户比较信赖出版社,比如我买计算机书,只买几个著名出版社的,其他出版社的书我对他的质量不信任。也有些时候看作者,比如C++,一般只买大牛的书。但是,豆瓣的推荐系统并没有学习出我的这些喜好(应该说没有完全学习出来),他们只是学习出我喜欢C++的书,但没有学习出我对作者和出版社的要求。这一方面因为我没有提供太多的喜好数据,另一方面也是因为可能并没有进行对这些特征的学习。

参考: http://vector-sci.blogspot.com/2009/07/blog-post_27.html(可能需要翻墙)

我的理解:即使推荐算法再先进,推荐的结果也一不定非常理想,必须要结合多方面的因素,然后才能使推荐结果更加准确。没有绝对准确的推荐系统,推荐结果可能只能让一部分用户或大部分用户满意,没有最好,只有更好。

4.Netflix Prize 给我们的启示是,没有一个单一的模型可以准确的反应出所有用户的行为。设计推荐系统需要组合不同的算法,发挥出群体的智能。

推荐系统目前最大的问题不是技术,而是没有合适的产品形态。搜索这种产品形态存在很久了,互联网之前就有,并且大家广泛接受,因此要作的是寻找更好的技术和合适的商业模式。推荐面临的问题是没有大家认可的产品形态,只能依附在别的产品上,并且由于这个产品本身不是为推荐设计的,80%的功能不是靠推荐来解决,推荐做得再好,也只是优化剩下的20%。
参考: http://www.guwendong.com/post/2009/resys_group.html

本文固定链接: http://www.chepoo.com/ecommended-several-issues-related-to-the-system.html | IT技术精华网

推荐系统相关的几个问题:等您坐沙发呢!

发表评论