如何使用 Apache DolphinScheduler 调度执行 Flume 数据采集任务？-尧图网站设计

转载自天地风雷水火山泽目的因为我们的数仓数据源是Kafka离线数仓需要用Flume采集Kafka中的数据到HDFS中。在实际项目中我们不可能一直在Xshell中启动Flume任务一是因为项目的Flume任务很多二是一旦Xshell页面关闭Flume任务就会停止这样非常不方便因此必须在后台启动Flume任务。所以经过测试后我发现海豚调度器也可以启动Flume任务。海豚调度Flume任务配置一Flume在Linux中的路径二Flume任务文件在Linux中的位置以及任务文件名三在海豚中配置运行脚本#!/bin/bash source /etc/profile /usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties注意/usr/local/hurys/dc_env/flume/flume190/为Flume在Linux中的安装根据自己安装路径进行调整四海豚任务配置好后就可以启动海豚任务五在HDFS对应文件夹中验证是否采集到数据可以看到Flume采集Kafka数据成功写入到HDFS中成功实现用Apache DolphinScheduler执行Flume任务的目的

如何使用 Apache DolphinScheduler 调度执行 Flume 数据采集任务？

相关新闻

告别繁琐！小鹿管家如何一键破解“千品千面”批量投放难题

别再被IEEEtran模板坑了！手把手教你搞定公式引用超链接和Bib报错（TeX Live 2024实测）

LangChain学习之提示词模板 Prompts（2/8）

Tenstorrent：基于RISC-V的异构计算架构如何挑战AI芯片市场

2026毕业季降AI工具排行榜，4款知网维普降AI软件横评

ADS 2022新手避坑指南：从库安装到S参数仿真，一次搞定高频电路设计

魔百盒CM311-1s刷机后体验：安卓9.0固件到底香不香？附5621DS无线实测

UVM验证中m_sequencer与p_sequencer：通用性与特定性的设计平衡

现代MCU片上外设集成：从设计原理到实战开发全解析

手把手教你用PlantUML和Gravizo：无需插件，在任意Markdown平台嵌入动态UML图

告别命令行恐惧：在Ubuntu 23.04上图形化玩转Mininet网络模拟（附MiniEdit配置全流程）

告别哑巴设备：用DY-SV17F语音模块给你的Arduino项目加上声音（附STM32串口控制代码）

2026年十大最佳地区搜索排名优化工具：权威榜单赋能企业高效增长

DDR3内存Row Hammer问题解析与防护方案

为ItsyBitsy ESP32设计3D打印外壳：从原型到产品的完整实践

别再手动点关了！用PowerShell永久关闭Windows Defender的保姆级教程（含Server 2016/2019）

别再只换芯片了！BP2832A替换CL1502，你的电感参数算对了吗？

全平台智能资源下载工具：res-downloader 完整使用教程