IDE下的MapReduce开发
在学校上Hadoop的课,Group Project要写一些MapReduce,学校给了cluster,但是在cluster上直接开vim写JAVA着实不怎么习惯。于是折腾了一下踩了些坑,在这里记录一下。
Git部署代码
首先想到的最方便的方式其实是用git。我平时写Python之类的脚本的时候就是用Git管理,然后Server上clone一个repo,就同步了。
但是发现这样的话我要单独写一个Makefile,管理编译等问题。 于是想到用IDE远程调试MapReduce.Intellij IDEA 开发MapReduce
Eclipse是有MapReduce插件的,安装好以后很方便各种调试。可我平时写JAVA比较习惯Intellij, 于是就找了一下intellij下的方案。
Maven来开发MapReduce
安装maven
brew install maven
在IntelliJ里面,右键项目,'Add Frameword support...'
选择maven
pom.xml的内容:
?xml version="1.0" encoding="UTF-8"?>4.0.0 4480Group16 stochastic 0.1 org.apache.hadoop hadoop-common 2.6.0 org.apache.hadoop hadoop-mapreduce-client-jobclient 2.6.0 commons-cli commons-cli 1.2 ${project.artifactId}
会问你是否import,选择auto import bulabula
Edit Configuration 里,选择application,将program argument填上你hdfs里的input和output path。
然后在main/java里面写code,打包jar部署。基本搞定