Mahout中相似度计算类介绍(六)
关键字: mahout similarity 推荐系统 最大似然估计
类名:LogLikelihoodSimilarity
名称:最大似然估计
最大似然估计,也称为最大概似估计,是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。
原理:
范围:[0,1]越接近1说明越相似。
说明:处理无打分的偏好数据,比Tanimoto系数的计算方法更为智能。
Java例子:
final DataModel dm = new FileDataModel(new File("e:\\recommend\\item.txt"));//文件名一定要是绝对路径 final ItemSimilarity similarity = new LogLikelihoodSimilarity(dm); GenericItemBasedRecommender recommender = new GenericItemBasedRecommender(dm,similarity); List<RecommendedItem> recommendations=recommender.mostSimilarItems(329387l, 3); //329387 为itemID for (RecommendedItem recommendation : recommendations) { System.out.println(recommendation.getItemID()); System.out.println(recommendation.getValue()); } |
参考文章:最大似然估计
本文固定链接: http://www.chepoo.com/mahout-class-similarity-calculation-described-6.html | IT技术精华网