久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

偽分布模式hadoop如何運行java源程序

199次閱讀
沒有評論

共計 3814 個字符,預計需要花費 10 分鐘才能閱讀完成。

偽分布模式 hadoop 如何運行 java 源程序,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面丸趣 TV 小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

寫好源代碼之后,首先要編譯:javac -classpath /usr/local/hadoop/hadoop-core-1.2.1.jar:/usr/local/hadoop/lib/commons-cli-1.2.jar count.java -d org 在 org 目錄下生成三個 class 文件:count.class count\ Map.class count\ Reduce.class 之后將三個 class 文件打包:jar -cvf count.jar -C org/ . 之后在 hadoop 根目錄下生成 count.jar 文件 創建分布式文件夾,并把要分析的數據放入之中:bin/hadoop fs -mkdir input bin/hadoop fs –put ~/Downloads/Gowalla_totalCheckins.txt input(~/Downloads/Gowalla_totalCheckins.txt 為我文件所在位置)通過 localhost:50070 可以查看:可以看到 txt 中的數據已經考到了 input 下。接下來運行程序:bin/hadoop jar count.jar count input output 運行完之后會發現:生成一個 output 文件夾,其下有三個文件,輸出的信息保存在 part-r-00000 中 文件內容: 

196514 2020-07-24T13:45:06Z 53.3648119 -2.2723465833 145064 196514 2020-07-24T13:44:58Z 53.360511233 -2.276369017 1275991 

196514 2020-07-24T13:44:46Z 53.3653895945 -2.2754087046 376497 196514 2020-07-24T13:44:38Z 53.3663709833 -2.2700764333 98503 

196514 2020-07-24T13:44:26Z 53.3674087524 -2.2783813477 1043431 

196514 2020-07-24T13:44:08Z 53.3675663377 -2.278631763 881734 

196514 2020-07-24T13:43:18Z 53.3679640626 -2.2792943689 207763 196514 2020-07-24T13:41:10Z 53.364905 -2.270824 1042822 

其中第一列為用戶 id,第二列為登錄時間,第三列是用戶的緯度,第四列我為用戶的經度,第五列為用戶的地址 id 本次程序是分析用戶的登錄時間,并分時間段進行統計。 

源代碼:

!-- lang: java -- 
import java.io.IOException; 
import java.util.*; 
import org.apache.hadoop.conf.Configuration; 
import org.apache.hadoop.fs.Path; 
import org.apache.hadoop.io.IntWritable; 
import org.apache.hadoop.io.Text; 
import org.apache.hadoop.mapreduce.Job; 
import org.apache.hadoop.mapreduce.Mapper; 
import org.apache.hadoop.mapreduce.Reducer; 
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; 
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; 
import org.apache.hadoop.util.GenericOptionsParser; 
public class count { 
public static class Map extends Mapper Object, Text, IntWritable, IntWritable  { 
 //  實現 map 函數  
  public void map(Object key, Text value, Context context)throws IOException, InterruptedException { 
 String line = value.toString(); 
  int k; 
 StringTokenizer itr = new StringTokenizer(line); 
 int i = 0; 
 int hour = 0,minute = 0,second = 0; 
    while (itr.hasMoreTokens()) { 
 String token = itr.nextToken(); 
  i++; 
 if(i == 2){ 
 int indexOfT = token.indexOf( T  
 int indexOfZ = token.indexOf(Z ,indexOfT + 1); 
   String substr = token.substring(indexOfT + 1,indexOfZ); 
 int blank1 = substr.indexOf( :  
 int blank2 = substr.indexOf(: ,blank1 + 1); 
 hour = Integer.parseInt(substr.substring(0,blank1),10); 
 minute = Integer.parseInt(substr.substring(blank1 + 1,blank2),10); 
 second = Integer.parseInt(substr.substring(blank2 + 1),10); 
 } 
    } 
   k = (hour * 60 * 60 + minute * 60 + second) / (3600 * 4) ; 
 context.write(new IntWritable( k ), new IntWritable(1)); 
  } 
} 
public static class Reduce extends Reducer  IntWritable, IntWritable, IntWritable, IntWritable  { 
  //  實現 reduce 函數  
 public void reduce(IntWritable key, Iterable IntWritable  values, Context context) 
  throws IOException, InterruptedException { 
 int sum = 0;  
 for(IntWritable val : values){ 
 sum += val.get(); } 
 context.write( key, new IntWritable(sum)); 
  } 
}  
public static void main(String[] args) throws Exception { 
 Configuration conf = new Configuration(); 
  String[] otherArgs = new GenericOptionsParser(conf, args).getRemainingArgs(); 
 if (otherArgs.length != 2) { 
  System.err.println( Usage: Multiple Table Join  in   out  
   System.exit(2); 
  } 
  Job job = new Job(conf,  count  
  job.setJarByClass(count.class); 
  //  設置 Map 和 Reduce 處理類  
  job.setMapperClass(Map.class); 
 job.setCombinerClass(Reduce.class); 
  job.setReducerClass(Reduce.class); 
  //  設置輸出類型  
 job.setOutputKeyClass(IntWritable.class); 
  job.setOutputValueClass(IntWritable.class); 
  FileInputFormat.addInputPath(job, new Path(otherArgs[0])); 
  FileOutputFormat.setOutputPath(job, new Path(otherArgs[1])); 
  System.exit(job.waitForCompletion(true) ? 0 : 1); 
} 
 }

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注丸趣 TV 行業資訊頻道,感謝您對丸趣 TV 的支持。

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-08-25發表,共計3814字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 大城县| 北宁市| 沅陵县| 黑河市| 神农架林区| 海南省| 炉霍县| 嘉荫县| 上栗县| 攀枝花市| 永昌县| 平湖市| 湖口县| 潮安县| 当阳市| 吴江市| 长春市| 西畴县| 肥西县| 成安县| 望谟县| 峡江县| 屏边| 英山县| 随州市| 蒙山县| 彭水| 屯留县| 连云港市| 鄂托克旗| 清苑县| 綦江县| 安西县| 靖远县| 金昌市| 宁强县| 鄂尔多斯市| 莎车县| 通化市| 湟中县| 六枝特区|