可商用开源软件etl 任务调度(开源精选ElasticJob)

《开源精选》是我们分享Github、Gitee等开源社区中优质项目的栏目,包括技术、学习、实用与各种有趣的内容。本期推荐的是 ElasticJob 一个面向互联网生态和海量任务的分布式调度解决方案,由两个相互独立的子项目 ElasticJob-Lite 和 ElasticJob-Cloud 组成。

可商用开源软件etl 任务调度(开源精选ElasticJob)(1)

ElasticJob可以通过弹性调度、资源管控、以及作业治理的功能,打造一个适用于互联网场景的分布式调度解决方案,并通过开放的架构设计,提供多元化的作业生态。 它的各个产品使用统一的作业 API,开发者仅需一次开发,即可随意部署。

ElasticJob 已于 2020 年 5 月 28 日成为 Apache ShardingSphere 的子项目。

官方网站:https://Shardingsphere.apache.org/elasticjob/

项目介绍

使用 ElasticJob 能够让开发工程师不再担心任务的线性吞吐量提升等非功能需求,使他们能够更加专注于面向业务编码设计; 同时,它也能够解放运维工程师,使他们不必再担心任务的可用性和相关管理需求,只通过轻松的增加服务节点即可达到自动化运维的目的。

ElasticJob-Lite

定位为轻量级无中心化解决方案,使用 jar 的形式提供分布式任务的协调服务。

可商用开源软件etl 任务调度(开源精选ElasticJob)(2)

架构图

ElasticJob-Cloud

采用自研 Mesos Framework 的解决方案,额外提供资源治理、应用分发以及进程隔离等功能。

可商用开源软件etl 任务调度(开源精选ElasticJob)(3)

架构图

功能列表

弹性调度

  • 支持任务在分布式场景下的分片和高可用能够水平扩展任务的吞吐量和执行效率任务处理能力随资源配备弹性伸缩

资源分配

  • 在适合的时间将适合的资源分配给任务并使其生效
  • 相同任务聚合至相同的执行器统一处理
  • 动态调配追加资源至新分配的任务

作业治理

  • 失效转移
  • 错过作业重新执行
  • 自诊断修复

作业依赖(TODO)

  • 基于有向无环图(DAG)的作业间依赖
  • 基于有向无环图(DAG)的作业分片间依赖

作业开放生态

  • 可扩展的作业类型统一接口
  • 丰富的作业类型库,如数据流、脚本、HTTP、文件、大数据等
  • 易于对接业务作业,能够与 Spring 依赖注入无缝整合

可视化管控端

  • 作业管控端
  • 作业执行历史数据追踪
  • 注册中心管理
环境要求

Java

请使用 Java 8 及其以上版本。

Maven

请使用 Maven 3.5.0 及其以上版本。

ZooKeeper

请使用 ZooKeeper 3.6.0 及其以上版本。

Mesos(仅 ElasticJob-Cloud 使用)

请使用 Mesos 1.1.0 及其兼容版本。

快速开始

ElasticJob-Lite

引入 Maven 依赖

<dependency> <groupId>org.apache.shardingsphere.elasticjob</groupId> <artifactId>elasticjob-lite-core</artifactId> <version>${latest.release.version}</version> </dependency>

作业开发

public class MyJob implements SimpleJob { @Override public void execute(ShardingContext context) { switch (context.getShardingItem()) { case 0: // do something by sharding item 0 break; case 1: // do something by sharding item 1 break; case 2: // do something by sharding item 2 break; // case n: ... } } }

作业配置

JobConfiguration jobConfig = JobConfiguration.newBuilder("MyJob", 3).cron("0/5 * * * * ?").build();

作业调度

public class MyJobDemo { public static void main(String[] args) { new ScheduleJobBootstrap(createRegistryCenter(), new MyJob(), createJobConfiguration()).schedule(); } private static CoordinatorRegistryCenter createRegistryCenter() { CoordinatorRegistryCenter regCenter = new ZookeeperRegistryCenter(new ZookeeperConfiguration("zk_host:2181", "my-job")); regCenter.init(); return regCenter; } private static JobConfiguration createJobConfiguration() { // 创建作业配置 // ... } }

ElasticJob-Cloud

引入 Maven 依赖

<dependency> <groupId>org.apache.shardingsphere.elasticjob</groupId> <artifactId>elasticjob-cloud-executor</artifactId> <version>${latest.release.version}</version> </dependency>

作业开发

public class MyJob implements SimpleJob { @Override public void execute(ShardingContext context) { switch (context.getShardingItem()) { case 0: // do something by sharding item 0 break; case 1: // do something by sharding item 1 break; case 2: // do something by sharding item 2 break; // case n: ... } } }

作业启动

public class MyJobDemo { public static void main(final String[] args) { JobBootstrap.execute(new MyJob()); } }

作业打包

tar -cvf my-job.tar.gz my-job

更多内容:https://shardingsphere.apache.org/elasticjob/index_zh.html

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页