Drizzle Spark 教程
2024-09-21 06:29:47作者:晏闻田Solitary
1. 项目目录结构及介绍
Drizzle Spark 是一个针对流处理和迭代工作负载的低延迟执行引擎。它通过引入分组调度技术,将多个批次的计算任务同时调度执行,从而减少任务调度开销,提高吞吐量和降低延迟。
Drizzle Spark 的项目目录结构如下:
drizzle-spark/
├── assembly
├── bin
├── build
├── common
├── conf
├── core
├── data
├── dev
├── docs
├── examples
├── external
├── graphx
├── launcher
├── licenses
├── mesos
├── mllib-local
├── mllib
├── project
├── python
├── repl
├── sbin
├── sql
├── streaming
├── tools
├── yarn
├── gitattributes
├── gitignore
├── travis.yml
├── CONTRIBUTING.md
├── LICENSE
├── NOTICE
├── README.md
├── SPARK-README.md
├── appveyor.yml
├── pom.xml
├── scalastyle-config.xml
└── .gitignore
2. 项目的启动文件介绍
Drizzle Spark 的启动文件位于 bin 目录下,主要包括以下几个脚本:
run-example: 运行 Drizzle Spark 示例程序。spark-class: Spark 程序的入口点。
3. 项目的配置文件介绍
Drizzle Spark 的配置文件位于 conf 目录下,主要包括以下几个文件:
spark-env.sh: Spark 环境配置文件。spark-defaults.conf: Spark 默认配置文件。log4j.properties: 日志配置文件。
总结
本文介绍了 Drizzle Spark 项目的目录结构、启动文件和配置文件,帮助用户快速了解和使用 Drizzle Spark。
登录后查看全文
热门项目推荐
暂无数据
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
539
3.76 K
Ascend Extension for PyTorch
Python
349
414
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
889
609
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
338
185
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
986
252
openGauss kernel ~ openGauss is an open source relational database management system
C++
169
233
暂无简介
Dart
778
193
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
114
140
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.35 K
758