介绍
本页主要描述,怎么在hadoop集群上运行Mahout Taste的推荐器
步骤
在那单个机器上测试
进入事例目录,执行:
mvn -q exec:java -Dexec.mainClass="org.apache.mahout.cf.taste.hadoop.pseudo.RecommenderJob" -Dexec.args="<OPTIONS>"
在集群上运行
1.进入$MAHOUT_HOME/,编辑jar包(mvn install),将在$MAHOUT_HOME/core/target/生成,并且名称包含版本号。例如当使用Mahout 0.3 release,将生成mahout-core-0.3.jar
2.(可选)启动hadoop:
$HADOOP_HOME/bin/start-all.sh
3.上传数据
$HADOOP_HOME/bin/hadoop fs -put <PATH TO DATA> testdata
4.运行任务:
$HADOOP_HOME/bin/hadoop jar $MAHOUT_HOME/core/target/mahout-core-<MAHOUT VERSION>.job org.apache.mahout.cf.taste.hadoop.<JOB> <OPTIONS>
5.从HDFS得到输出数据,并且查看。使用
bin/hadoop fs -lsr output
查看所有的output文件
命令行选项
在命令行使用"--help" 得到完整的命令行选项摘要信息。或者在javadoc中"Job"类下查看
补充:
运行的完整例子
hadoop jar mahout-core-0.4-job.jar org.apache.mahout.cf.taste.hadoop.pseudo.RecommenderJob -i mahout-testing.txt -o out --recommenderClassName org.apache.mahout.cf.taste.impl.recommender.slopeone.SlopeOneRecommender
原文地址:https://cwiki.apache.org/confluence/display/MAHOUT/TasteCommandLine
分享到:
相关推荐
#资源达人分享计划#
Hadoop-Mahout 使用 Mahout 在 Hadoop 上进行推荐、集群和分类
基于Hadoop与Mahout云数据挖掘推荐研究.pdf
29.第二十九套:机器学习平台mahout,推荐系统算法与架构剖析视频教程
#资源达人分享计划#
MovieRecommender基于Mahout实现协同过滤推荐算法的电影推荐系统^
基于内容的推荐 基于热点的推荐 Mahout:整体框架,实现了协同过滤 Deeplearning4j,构建VSM Jieba:分词,关键词提取 HanLP:分词,关键词提取 Spring Boot:提供API、ORM 关键实现 基于用户的协同过滤 直接...
这里是我个人的bug,没有被解决
Hadoop,Hbase,mahout三者兼容版本的API文档,这三个API版本对应的Hadoop组件相互兼容,很方便的
mahout0.9仅支持hadoop1.x,编译好的这个包支持hadoop2.2.0.由于上传文件50M的限制,采用分卷压缩的形式,包括三个包:mahout-mahout-distribution-0.9.zip,distribution-0.9.z01,mahout-distribution-0.9.z02,...
基于Mahout的电影推荐系统的数据文件,数据文件包含(users.dat、moives.dat、ratings.dat、movie_preferences.txt)。
基于用户的简单推荐 保证可以运行 用到了mahout的相关算法
基于Mahout的新闻推荐系统 相关技术 推荐算法 基于用户的协同过滤 基于内容的推荐 基于景点的推荐 :整体框架,实现了协同过滤 ,建立VSM :分词,关键词提取 :分词,关键词 :提供API,ORM 关键实现 基于用户...
基于Mahout实现协同过滤推荐算法的电影推荐系统
mahout0.9的源码,支持hadoop2,需要自行使用mvn编译。mvn编译使用命令: mvn clean install -Dhadoop2 -Dhadoop.2.version=2.2.0 -DskipTests
这是这篇博文的工程代码,是MyEclipse的工程文件。...由于原工程开发的时候是在MyEclipse中引用mahout的jar包,所以这个压缩文件并没有相关的jar文件,故运行此项目之前需要做的事请,是需要导入mahout的开发包。
mahout0.9仅支持hadoop1.x,编译好的这个包支持hadoop2.2.0.由于上传文件50M的限制,采用分卷压缩的形式,包括三个包:mahout-mahout-distribution-0.9.zip,distribution-0.9.z01,mahout-distribution-0.9.z02,...
mahout0.9仅支持hadoop1.x,编译好的这个包支持hadoop2.2.0.由于上传文件50M的限制,采用分卷压缩的形式,包括三个包:mahout-mahout-distribution-0.9.zip,distribution-0.9.z01,mahout-distribution-0.9.z02,...