如何用Data Formulator打造AI驱动的数据可视化：从零开始的完整指南

2026-02-04 05:15:46作者：袁立春Spencer

Data Formulator是一款由Microsoft Research开发的AI驱动数据可视化工具，它让用户能够轻松创建丰富的图表和报告，无需复杂的编程知识。无论是数据分析新手还是专业人士，都能通过直观的界面和AI辅助功能，将原始数据转化为富有洞察力的可视化作品。

为什么选择Data Formulator？

在数据驱动决策的时代，有效的数据可视化至关重要。Data Formulator通过AI技术简化了这一过程，让每个人都能成为数据可视化专家。

Data Formulator直观的用户界面，左侧为数据线程，右侧为可视化编辑区域

核心优势

AI驱动的可视化：无需编写代码，AI自动生成图表
多源数据支持：从文件、截图、文本甚至数据库加载数据
灵活的探索模式：从完全手动到全自动AI代理，满足不同需求
实时数据更新：连接实时数据源，可视化内容自动刷新
报告生成功能：一键创建专业报告，轻松分享洞见

快速开始：安装与设置

系统要求

Python 3.8或更高版本
现代浏览器（Chrome、Firefox、Edge等）
网络连接（用于AI模型访问）

安装步骤

最简单的安装方式是通过Python PIP：

# 安装data_formulator
pip install data_formulator

# 运行Data Formulator
python -m data_formulator

程序会自动在浏览器中打开，默认地址为http://localhost:5000。如果需要指定端口，可以使用：

python -m data_formulator --port 8080

数据可视化的四个层级

Data Formulator提供了灵活的探索方式，从完全手动控制到全自动AI代理，满足不同用户的需求：

层级一：完全手动（最高控制度）

直接通过拖放操作创建图表，适用于数据字段已整理完毕的情况。只需从数据表格中拖动字段到编码区域，即可生成基础图表。

层级二：自然语言辅助

描述你想要的图表类型和数据转换需求，AI会自动处理数据并生成可视化结果。例如，你可以输入"显示各产品类别的年度销售额增长率"，AI会自动计算增长率并生成相应图表。

层级三：AI推荐

让AI根据你的数据推荐有意义的可视化方式。点击"获取灵感"按钮，系统会分析数据特征并提供多种可视化建议。

层级四：AI代理模式（最高自动化）

使用AI代理模式分析可再生能源数据的示例

在代理模式下，只需提供一个高层次的分析目标，AI会自动规划探索路径，创建多个相关图表，并在过程中提出问题以进一步明确需求。

从数据到报告：完整工作流程

1. 数据加载

Data Formulator支持多种数据来源：

上传CSV、TSV或Excel文件
从截图中提取数据
从文本块中解析数据
连接数据库（MySQL、PostgreSQL、MongoDB等）
加载实时数据源

2. 数据探索

使用Data Threads功能记录你的探索过程，每个线程代表一个分析方向。你可以随时创建新线程、分支现有线程，或返回到之前的分析状态。

3. 可视化创建

通过编码架（Encoding Shelf）指定图表类型和数据映射关系。即使数据中不存在所需字段，也可以直接输入新字段名称，AI会自动计算并生成。

4. 报告生成

基于电影数据自动生成的分析报告

选择有价值的图表，使用报告生成器创建结构化报告。你可以编辑报告内容，调整图表布局，并导出为多种格式分享给他人。

高级功能探索

数据清洗与转换

Data Formulator内置数据清洗功能，AI可以自动识别并处理缺失值、异常值和不一致的数据格式。对于复杂转换需求，可以直接使用自然语言描述。

多表关联分析

支持同时加载多个数据集，并通过AI自动识别关联关系，实现跨表分析。这对于复杂数据分析场景特别有用。

自定义图表模板

高级用户可以创建自定义图表模板，保存常用的可视化配置，以便在未来分析中快速复用。

结语：释放数据的力量

Data Formulator通过AI技术民主化了数据可视化能力，让每个人都能轻松从数据中提取洞见。无论你是学生、分析师还是业务决策者，这款工具都能帮助你更高效地理解和传达数据信息。

立即尝试Data Formulator，开启你的AI驱动数据可视化之旅！

# 开始使用
pip install data_formulator
python -m data_formulator

相关资源

官方文档：DEVELOPMENT.md
数据加载器源码：py-src/data_formulator/data_loader/
AI代理功能：py-src/data_formulator/agents/
贡献指南：CONTRIBUTING.md

data-formulator

🪄 Data Formulator is an interactive AI-powered data analysis system makes it easy to connect, explore and visualize data.

项目地址：https://gitcode.com/GitHub_Trending/da/data-formulator

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

515

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

647

284

如何用Data Formulator打造AI驱动的数据可视化：从零开始的完整指南

为什么选择Data Formulator？

核心优势

快速开始：安装与设置

系统要求

安装步骤

数据可视化的四个层级

层级一：完全手动（最高控制度）

层级二：自然语言辅助

层级三：AI推荐

层级四：AI代理模式（最高自动化）

从数据到报告：完整工作流程

1. 数据加载

2. 数据探索

3. 可视化创建

4. 报告生成

高级功能探索

数据清洗与转换

多表关联分析

自定义图表模板

结语：释放数据的力量

相关资源

热门内容推荐

最新内容推荐

项目优选

如何用Data Formulator打造AI驱动的数据可视化：从零开始的完整指南

为什么选择Data Formulator？

核心优势

快速开始：安装与设置

系统要求

安装步骤

数据可视化的四个层级

层级一：完全手动（最高控制度）

层级二：自然语言辅助

层级三：AI推荐

层级四：AI代理模式（最高自动化）

从数据到报告：完整工作流程

1. 数据加载

2. 数据探索

3. 可视化创建

4. 报告生成

高级功能探索

数据清洗与转换

多表关联分析

自定义图表模板

结语：释放数据的力量

相关资源

相关内容推荐

热门内容推荐

最新内容推荐

项目优选