作家
登录

Apache Beam 剖析

作者: 来源: 2017-04-11 11:01:11 阅读 我要评论

      -DartifactId=word-count-beam \ 
  •       -Dversion="0.1" \ 
  •       -Dpackage=org.apache.beam.examples \ 
  •       -DinteractiveMode=false 
  • 此时,敕令会创建一个文件夹 word-count-beam,琅绫擎包含一个 pom.xml 和相干的代码文件。敕令如下所示:

    1. $ cd word-count-beam/ 
    2.  
    3. $ ls 
    4. pom.xml    src 
    5.  
    6. $ ls src/main/java/org/apache/beam/examples/ 
    7. DebuggingWordCount.java    WindowedWordCount.java    common 
    8. MinimalWordCount.java    WordCount.java 

    3.3 运行 WordCount 示例代码

    一个 Beam 法度榜样可以运行在多个 Beam 的可履行引擎上,包含 ApexRunner,FlinkRunner,SparkRunner 或者 DataflowRunner。 别的还有 DirectRunner。不须要特别的设备就可以在本地履行,便利测试应用。

    下面,你可以按需选择你想履行法度榜样的引擎:

    1. 对引擎进行相干设备
    2. 应用不合的敕令:经由过程 –runner=<runner>参数指明引擎类型,默认是 DirectRunner;添加引擎相干的参数;指定输出文件和输出目次,当然这里须要包管文件目次是履行引擎可以拜访到的,比如本地文件目次是不克不及被外部集群拜访的。
    3. 运行示例法度榜样

    3.3.1 Direct

    3.4.2 Apex

    1. $ mvn compile exec:java -Dexec.mainClass=org.apache.beam.examples.WordCount \  
    2. -Dexec.args="--inputFile=pom.xml --output=counts" -Pdirect-runner 

    3.3.2 Apex

    3.4.5 Spark

    1. $ mvn compile exec:java -Dexec.mainClass=org.apache.beam.examples.WordCount \ 
    2.      -Dexec.args="--inputFile=pom.xml --output=counts --runner=ApexRunner" -Papex-runner 

    3.3.3 Flink-Local

    1. $ mvn compile exec:java -Dexec.mainClass=org.apache.beam.examples.WordCount \  
    2. -Dexec.args="--runner=FlinkRunner --inputFile=pom.xml --output=counts" -Pflink-runner 

    3.3.4 Flink-Cluster

    1. $ mvn package exec:java -Dexec.mainClass=org.apache.beam.examples.WordCount \  
    2. -Dexec.args="--runner=FlinkRunner --flinkMaster=<flink master> --filesToStage=target/word-count-beam-bundled-0.1.jar \  
    3. --inputFile=/path/to/quickstart/pom.xml --output=/tmp/counts" -Pflink-runner 

    然后,你可以经由过程拜访 http://<flink master>:8081 来监测运行的应用法度榜样。

    1. $ cat counts* 
    2. BEAM: 1 
    3. have: 1 
    4. simple: 1 
    5. skip: 4 
    6. PAssert: 1 
    7. ... 

    3.3.5 Spark

    3.3.6 Dataflow

    1. $ mvn compile exec:java -Dexec.mainClass=org.apache.beam.examples.WordCount \ 
    2.      -Dexec.args="--runner=DataflowRunner --gcpTempLocation=gs://<your-gcs-bucket>/tmp \

        推荐阅读

        Gradle for Android 第四篇( 构建变体 )

      当你在开辟一个app,平日你会有几个版本。大年夜多半情况是你须要一个开辟版本,用来测试app和弄清它的质量,然后还须要一个临盆版本。这些版本平日有不合的设置,例如不合的URL地址。更可>>>详细阅读


      本文标题:Apache Beam 剖析

      地址:http://www.17bianji.com/lsqh/34709.html

    关键词: 探索发现

    乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

    网友点评
    自媒体专栏

    评论

    热度

    精彩导读
    栏目ID=71的表不存在(操作类型=0)