博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
整合 Tachyon 运行 Apache Flink(译)
阅读量:7198 次
发布时间:2019-06-29

本文共 1368 字,大约阅读时间需要 4 分钟。

  hot3.png

整合 Tachyon 运行 Apache Flink

本人详述了如何基于Tachyon 运行 , 这样在 Tachyon 中可以很便捷的处理文件存储。

前提

首先,得存在 Java 环境。 我们也假设你已经根据  或  指导安装了 Tachyon 和 Flink 。

请在 Apache Flink   查找指导设置Flink

配置

Apache Flink 允许通过文件系统包装Hadoop文件系统使用Tachyon。所有,配置Tachyonn主要是在 Hadoop 配置文件中。

在 core-site.xml 配置属性

如果你已经有 Hadoop 配置,接下来 Flink 安装,添加如下属性在 core-site.xml 配置文件:

<property>

    <name>fs.tachyon.impl</name>
    <value>tachyon.hadoop.TFS</value>
</property>

如果你没有配置 hadoop,你必须要创建 core-site.xml 并且添加下面的Property:

    
        
fs.tachyon.impl
        
tachyon.hadoop.TFS
    

确保 core-site.xml 的路径在 conf/flink-config.yaml

接下来,你必须在在Flink中指定Hadoop配置的路径, 在 Flink 根目录下打开 conf/flink-config.yaml, 到含有 core-site.xml   directory  设置配置 fs.hdfs.hadoopconf 的值。在 Hadoop 更新版本中,该目录通常以 etc/hadoop/ 结尾。

确保 Flink 对于 tachyon-0.7.1.jar 是可用的

在最后一步中,我们需要确保 Tachyon jar 文件对于 Flink 是可用的,因为它包含 tachyon.hadoop.TFS 类的配置。

有以下几种不同方式来实现:

  • 将 tachyon-0.7.1.jar 文件放入Flink 的 lib/ 的目录下 (为本地和伪集群配置)

  • 将 tachyon-0.7.1.jar 文件放入Flink 对于 YARN 的 ship/ 目录下

  • 在HADOOP_CLASSPAH 环境变量中指定 jar 文件位置 (确保所有集群节点都是可用的). 例如像这样:

    export HADOOP_CLASSPATH=/pathToTachyon/client/target/tachyon-client-0.7.1-jar-with-dependencies.jar

结合Tachyon 使用 Flink

为了结合 Tachyon 使用 Flink,仅仅需要使用 tachyon://scheme 。

如果Tachyon是本地安装,有效的路径是类似这样:tachyon://localhost:19998/user/hduser/gutenberg

转载于:https://my.oschina.net/Rayn/blog/519197

你可能感兴趣的文章
7.4 括号匹配
查看>>
nginx + fastDFS 设置开机自动启动
查看>>
Redis.py客户端的命令总结【一】
查看>>
AlertDialog错误
查看>>
Tiling 简单递推+大数
查看>>
iOS开发UI篇—Quartz2D使用(绘制基本图形)
查看>>
java web servlet
查看>>
几个博客
查看>>
v4l2
查看>>
JS倒计时
查看>>
(new Function("return " + json))();
查看>>
mscrm 4.0 报表服务器报错
查看>>
SVM原理简介
查看>>
TLV----Demo讲解
查看>>
Mermaid js与流程图、甘特图..
查看>>
java 调度框架quartz
查看>>
hadoop exit code 退出码含义
查看>>
[C#基础知识系列]专题十:全面解析可空类型
查看>>
什么是.Net的异步机制(线程间通信) - step 5
查看>>
Lambda应用设计模式
查看>>