作家
登录

Spark源码分析之分区器的作用

作者: 来源: 2017-04-24 14:03:54 阅读 我要评论

  •         int code = k.hashCode() % 1000; 
  •         System.out.println(k+":"+code); 
  •         return  code < 0?code+1000:code; 
  •     } 
  •  
  •     @Override 
  •     public boolean equals(Object obj) { 
  •         if(obj instanceof MyPartioner){ 
  •             if(this.numPartitions()==((MyPartioner) obj).numPartitions()){ 
  •                 return true
  •             } 
  •             return false
  •         } 
  •         return super.equals(obj); 
  •     } 
  • 应用的时刻,可以直接new一个对象即可。

    1. pairRdd.groupbykey(new MyPartitioner()) 

    如许自定义分区器就完成了。

    1. def nonNegativeMod(x: Int, mod: Int): Int = { 
    2.     val rawMod = x % mod 
    3.     rawMod + (if (rawMod < 0) mod else 0) 
    4.   } 

    【编辑推荐】

    1. 百万自媒体大年夜V的数据分析师成长线路,薪水过万难吗?
    2. 数据分析的一些常见问题
    3. 若何做好数据精细化分析,让你的运营效不雅指数级增长?
    4. 数据分析与可视化,你靠什么搞定?
    5. Spark:超出Hadoop MapReduce
    【义务编辑:武晓燕 TEL:(010)68476606】

      推荐阅读

      SDN能解决很多问题,但不包括安全

    跟着数字化企业尽力寻求最佳安然解决筹划来保护其赓续扩大的收集,很多企颐魅正在寻求供给互操作性功能的下一代对象。软件定义收集(SDN)具有很多的优势,经由过程将多个设备的┞菲握平面整>>>详细阅读


    本文标题:Spark源码分析之分区器的作用

    地址:http://www.17bianji.com/lsqh/34919.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)