【译】mahout in action 6 分布式计算推荐器（Distributing Recommendation Computations）

博客分类：

Mahout in action

本章包括：
。从维基百科统计分析大量的数据
。编写在hadoop上使用的推荐器和分布式算法
。伪分布式存在非分布式的推荐器

我们越来越关注日益增长的数据，自从开始这本书：从10个选择，到100,000到1千万，和现在1.7千万。这里仍旧只有半成品在推荐领域。本章，我们将再次处理大量的数据，超过1.3亿的“偏好”在提交维基百科的文章到文章的连接选择。在这个数据集合，用户和项目都是条件约束，他们展示怎么推荐可以有效的实施针对较少的常见内容。

针对展示1.3亿“偏好”仍然是易于控制的大小，它是一个这样的刻度：换句话说我们过去看到的，对单机处理很麻烦的推荐器。我们将部署新的推荐算法，使用分布式计算着手处理基于MapReduce和hadoop

分享到：

【译】mahout in action 6.1从维基百科统计 ... | Mahout基于hadoop的推荐器（Recommender）

2011-02-24 17:41
浏览 3120
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

【译】mahout in action 6 分布式计算推荐器（Distributing Recommendation Computations）

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

【译】mahout in action 6 分布式计算推荐器（Distributing Recommendation Computations）

评论

发表评论

相关推荐

【译】mahout in action 3.3 内存中的DataModel

【译】mahout in action 3.2 加速聚集

【译】mahout in action 3.1 Preference对象

【译】mahout in action 3 数据展现

【译】mahout in action 2.6 小结

【译】mahout in action 2.5 评估GroupLens数据集合

【译】mahout in action 2.4 评估的精确和调用

【译】mahout in action 2.3 推荐器考核

【译】mahout in action 2.2 运行首个推荐引擎

【译】mahout in action 2.1 什么是推荐器？

【译】mahout in action 2 推荐器介绍

【译】mahout in action 1.7 总结

【译】mahout in action 1.6 安装Mahout

【译】mahout in action 1.4 扩展性Scaling up

【译】mahout in action 1.4 分类Classification

【译】mahout in action 1.3 聚类Clustering

【译】mahout in action 1.2 推荐引擎Recommender Engines

【译】mahout in action 1.1 Mahout是否适合我

【译】mahout in action 6.3 基于hadoop实现分布式计算

【译】mahout in action 6.1从维基百科统计分析大量的数据

最近访客更多访客>>