The Turing Way项目:如何为开源书籍添加Scriberia插图和替代文本
2025-07-05 18:14:57作者:曹令琨Iris
在The Turing Way这个开源数据科学指南项目中,Scriberia风格的插图是书籍内容的重要组成部分。这些生动形象的插图为技术概念提供了直观的可视化表达,大大提升了读者的学习体验。本文将详细介绍如何为The Turing Way书籍添加这些插图并编写高质量的替代文本(alt text)。
Scriberia插图的价值
Scriberia是一家专门从事视觉笔记和插画创作的工作室,他们为The Turing Way项目创作了大量精美的技术概念插图。这些插图具有以下特点:
- 将抽象的技术概念具象化
- 通过视觉叙事增强理解
- 增加书籍的吸引力和可读性
- 为视觉学习者提供额外的学习途径
添加插图的完整流程
1. 选择合适的插图
项目团队已经将多批Scriberia插图上传至Zenodo平台,包括V10到V13等多个版本。在选择插图时需要考虑:
- 插图与书籍内容的匹配度
- 插图是否已经存在于项目仓库中
- 插图是否已经被其他贡献者选中
2. 确定插图位置
仔细阅读书籍内容,找到最能体现插图价值的章节。例如:
- 数据存储库插图适合放在"可重复研究"章节
- 代码风格插图适合放在"项目设计"部分
3. 技术实现步骤
- 创建新的Git分支
- 将插图文件添加到figures目录
- 在Markdown文件中插入图片引用代码
- 编写高质量的替代文本
- 提交Pull Request并请求审查
替代文本编写指南
替代文本(alt text)对于可访问性至关重要,它帮助视觉障碍用户理解图片内容。编写时应遵循以下原则:
- 准确描述图片中的关键元素
- 保持简洁明了
- 包含图片传达的核心概念
- 避免使用"图片显示..."等冗余表述
项目团队已经整理了历史书签活动中编写的替代文本,可以作为参考模板。对于现有插图的替代文本,贡献者需要:
- 修正拼写错误
- 优化描述准确性
- 确保技术术语的一致性
贡献示例
在实际贡献过程中,多位贡献者展示了标准的协作流程:
- 选择特定插图并声明处理意向
- 确定最佳放置位置
- 执行技术实现并提交PR
- 经过同行审查后合并
例如,有贡献者为"实践者中心案例研究"章节添加了专家协作插图,为"数据存储库"部分添加了数据管理插图,这些都为书籍内容增添了重要价值。
总结
参与The Turing Way的Scriberia插图添加工作是一个绝佳的贡献机会,特别适合初次接触开源项目的新手。通过这个过程,贡献者可以:
- 熟悉Git和GitHub工作流
- 学习Markdown语法
- 理解可访问性设计原则
- 参与有意义的开源协作
这种低门槛但高价值的贡献方式,正是The Turing Way社区倡导的开放协作精神的完美体现。
登录后查看全文
热门项目推荐
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
项目优选
收起
deepin linux kernel
C
24
9
Ascend Extension for PyTorch
Python
223
245
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
暂无简介
Dart
672
157
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
662
312
React Native鸿蒙化仓库
JavaScript
262
322
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
64
19
仓颉编译器源码及 cjdb 调试工具。
C++
134
867
仓颉编程语言测试用例。
Cangjie
37
860
openGauss kernel ~ openGauss is an open source relational database management system
C++
160
218