DolphinScheduler/docs/zh_CN/后端部署文档.md
2019-04-19 18:03:07 +08:00

5.6 KiB
Raw Blame History

后端部署文档

后端有2种部署方式分别为自动化部署和编译源码部署

1、准备工作

目前最新安装包版本是1.0.1,下载地址: 码云下载 下载escheduler-backend-1.0.1.tar.gz后,解压后会产生escheduler-backend-1.0.1目录(后面简称escheduler-backend)

准备一: 基础软件安装(必装项请自行安装)

  • Mysql (5.5+) : 必装
  • JDK (1.8+) : 必装
  • ZooKeeper(3.4.6) :必装
  • Hadoop(2.6+) :选装, 如果需要使用到资源上传功能MapReduce任务提交则需要配置Hadoop(上传的资源文件目前保存在Hdfs上)
  • Hive(1.2.1) : 选装hive任务提交需要安装
  • Spark(1.x,2.x) : 选装Spark任务提交需要安装
  • PostgreSQL(8.2.15+) : 选装PostgreSQL PostgreSQL存储过程需要安装
 注意EasyScheduler本身不依赖Hadoop、Hive、Spark、PostgreSQL,仅是会调用他们的Client用于对应任务的运行。

准备二: 创建部署用户

  • 在所有需要部署调度的机器上创建部署用户因为worker服务是以 sudo -u {linux-user} 方式来执行作业,所以部署用户需要有 sudo 权限,而且是免密的。
vi /etc/sudoers

# 例如部署用户是escheduler账号
escheduler  ALL=(ALL)       NOPASSWD: NOPASSWD: ALL

# 并且需要注释掉 Default requiretty 一行
#Default requiretty

准备三: ssh免密配置

在部署机器和其他安装机器上配置ssh免密登录如果要在部署机上安装调度需要配置本机免密登录自己

准备四:数据库初始化

  • 创建database和账号

    通过以下mysql命令进入mysql命令行服务

    mysql -h {host} -u {user} -p{password}

    然后执行以下命令创建database和账号

    CREATE DATABASE escheduler DEFAULT CHARACTER SET utf8 DEFAULT COLLATE utf8_general_ci;
    GRANT ALL PRIVILEGES ON escheduler.* TO '{user}'@'%' IDENTIFIED BY '{password}';
    GRANT ALL PRIVILEGES ON escheduler.* TO '{user}'@'localhost' IDENTIFIED BY '{password}';
    flush privileges;
    
  • 创建表和导入基础数据 说明在escheduler-backend/sql/escheduler.sql和quartz.sql

    mysql -h {host} -u {user} -p{password} -D {db} < escheduler.sql
    
    mysql -h {host} -u {user} -p{password} -D {db} < quartz.sql
    

准备五: 修改部署目录权限及运行参数

我们先来大体了解下解压后escheduler-backend目录下的文件(夹)的作用

bin : 基础服务启动脚本
conf : 项目配置文件
lib : 项目依赖jar包包括各个模块jar和第三方jar
script : 集群启动、停止和服务监控启停脚本
sql : 项目依赖sql文件
install.sh : 一键部署脚本
  • 修改权限(请将deployUser自行修改为对应部署用户)使得部署用户对escheduler-backend目录有操作权限

    sudo chown -R deployUser:deployUser escheduler-backend

  • 修改conf/env/目录下的escheduler_env.py .escheduler_env.sh 两个文件中的环境变量

  • 修改部署参数(根据自己服务器及业务情况):

  • 修改 install.sh中的各参数,替换成自身业务所需的值

  • 如果使用hdfs相关功能需要拷贝hdfs-site.xmlcore-site.xml到conf目录下

2、部署

推荐自动化部署,有经验的小伙伴也可以使用源码部署

2.1 自动部署

  • 安装zookeeper工具

    pip install kazoo

  • 切换到部署用户,一键部署

    sh install.sh

  • 使用jps命令查看服务是否启动(jps为java JDK自带)

    MasterServer         ----- master服务
    WorkerServer         ----- worker服务
    LoggerServer         ----- logger服务
    ApiApplicationServer ----- api服务
    AlertServer          ----- alert服务

如果有以上5个服务说明自动部署成功

部署成功后,可以进行日志查看,日志统一存放于指定文件夹内

 logs/
    ├── escheduler-alert-server.log
    ├── escheduler-master-server.log
    |—— escheduler-worker-server.log
    |—— escheduler-api-server.log
    |—— escheduler-logger-server.log

2.2 编译源码来部署

将源码包release版本1.0.1下载后,解压进入根目录

  • 执行编译命令:
 mvn -U clean package assembly:assembly -Dmaven.test.skip=true
  • 查看目录

正常编译完后,会在当前目录生成 target/escheduler-{version}/ 然后参考

2.3 系统常用启停服务(服务用途请具体参见《系统架构设计》小节)

  • 一键停止集群所有服务

    sh ./script/stop_all.sh

  • 一键开启集群所有服务

    sh ./script/start_all.sh

  • 启停Master

sh ./bin/escheduler-daemon.sh start master-server
sh ./bin/escheduler-daemon.sh stop master-server
  • 启停Worker
sh ./bin/escheduler-daemon.sh start worker-server
sh ./bin/escheduler-daemon.sh stop worker-server
  • 启停Api
sh ./bin/escheduler-daemon.sh start api-server
sh ./bin/escheduler-daemon.sh stop api-server
  • 启停Logger
sh ./bin/escheduler-daemon.sh start logger-server
sh ./bin/escheduler-daemon.sh stop logger-server
  • 启停Alert
sh ./bin/escheduler-daemon.sh start alert-server
sh ./bin/escheduler-daemon.sh stop alert-server