首页
/ ```markdown

```markdown

2024-06-16 00:19:29作者:翟江哲Frasier
# 推荐文章:Continuous Intelligence 和 CD4ML 工作坊 —— 让机器学习部署自动化





## 项目介绍

在当今的数字时代,数据科学和机器学习(Machine Learning, ML)正以前所未有的速度改变着我们的工作方式。但是,如何将这些复杂的模型从实验阶段过渡到生产环境,并保持其持续的智能和效率,一直是个挑战。**连续情报和 CD4ML 工作坊**正是为解决这一难题而设计。

这个由ThoughtWorks开发并不断进化的工坊,基于已有的[CD4ML Workshop](https://github.com/ThoughtWorksInc/cd4ml-workshop),专为那些希望实现**连续交付机器学习(Continuous Delivery for Machine Learning)**与建立**连续情报系统(Continuous Intelligence systems)**的人士准备。通过这个平台,参与者将能够体验从设置环境到运行复杂服务的全过程,无需预先下载或安装任何软件。

## 技术分析

### 核心工具链

工坊精心集成了多个强大的工具:

- **Python 3.9**: 强大的编程语言,适用于各种数据分析任务。
- **Docker**: 隔离且可移植的应用容器解决方案,简化了开发流程。
- **Jenkins**: 自动化构建、测试和部署的持续集成服务器。
- **EFK堆栈**(ElasticSearch, Fluentd, Kibana): 日志管理和可视化的一体化解决方案。
- **JupyterLab**: 弹性的工作空间,适用于代码编写、文档编写等。
- **MLFlow**: 跟踪和管理ML实验的开放源码平台。
- **Minio**: 分布式云存储服务,用于大规模数据存储。

所有工具均以Docker容器形式自动配置,极大降低了参与者的入门门槛。

## 应用场景与技术实施

### 销售预测与房地产价格预测案例

本工坊提供了两个实战型的ML问题——销售预测和房地产价格预测,旨在让用户亲身体验CD4ML的全流程。利用Favorita公司提供的销售数据和Zillow集团的数据集,参与者不仅可以了解如何处理实际数据,还能掌握ML模型的训练、优化及部署方法。

### 环境链接概览

成功搭建环境后,一系列关键组件如Jenkins、JupyterLab、MLFlow、以及Kibana/fluentD/Elasticsearch等将自动启动,在`http://localhost:3000`上即可访问。这不仅简化了操作过程,还确保了信息的一致性和实时反馈。

## 项目特色

- **一站式ML模型生命周期管理**:从数据预处理到模型评估,再到结果可视化,一应俱全。
- **无缝集成**:所有所需的服务和工具都已在Docker环境中自动配置,避免了繁琐的手动安装步骤。
- **实用的案例研究**:结合真实世界的商业问题,让理论与实践紧密结合。
- **易于上手的学习路径**:清晰有序的教程指南,逐步引导用户完成从基础到高级的技能提升。

总之,**连续情报和 CD4ML 工作坊**是每个渴望提升数据科学能力团队的理想选择,无论您是初学者还是有经验的技术人员,都能在此找到适合自己的成长之路。现在就加入我们,开启您的机器学习之旅吧!




热门项目推荐
相关项目推荐

项目优选

收起
Python-100-DaysPython-100-Days
Python - 100天从新手到大师
Python
267
55
国产编程语言蓝皮书国产编程语言蓝皮书
《国产编程语言蓝皮书》-编委会工作区
65
17
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
196
45
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
53
44
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
268
69
qwerty-learnerqwerty-learner
为键盘工作者设计的单词记忆与英语肌肉记忆锻炼软件 / Words learning and English muscle memory training software designed for keyboard workers
TSX
333
27
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
896
0
advanced-javaadvanced-java
Advanced-Java是一个Java进阶教程,适合用于学习Java高级特性和编程技巧。特点:内容深入、实例丰富、适合进阶学习。
JavaScript
419
108
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
144
24
HarmonyOS-Cangjie-CasesHarmonyOS-Cangjie-Cases
参考 HarmonyOS-Cases/Cases,提供仓颉开发鸿蒙 NEXT 应用的案例集
Cangjie
58
4