ggplot2图形设计:标签与注释的艺术
2025-06-02 23:46:02作者:尤峻淳Whitney
引言
在数据可视化中,标签和注释是提升图表可读性和表达力的关键元素。本文将基于RStudio Conf 2022中关于ggplot2图形设计的研讨会内容,深入探讨如何利用ggplot2的强大功能来优化图表中的标签和注释。
准备工作
首先,我们需要加载必要的库并准备数据:
library(tidyverse)
bikes <- read_csv("london-bikes-custom.csv",
col_types = "Dcfffilllddddc")
bikes$season <- forcats::fct_inorder(bikes$season)
theme_set(theme_light(base_size = 14, base_family = "Roboto Condensed"))
基础标签设置
使用labs()函数
labs()函数是ggplot2中设置标签的主要方式,可以定义标题、副标题、坐标轴标签、图例标题等:
ggplot(bikes, aes(x = temp_feel, y = count, color = season)) +
geom_point(alpha = .5) +
labs(
x = "Feels Like temperature (°F)",
y = "Reported bike shares",
title = "TfL bike sharing trends",
subtitle = "Reported bike rents versus Feels Like temperature in London",
caption = "Data: TfL",
color = "Season:",
tag = "1."
)
通过theme()定制标签样式
标题样式调整
使用theme()可以精细控制标签的视觉表现:
g + theme(
plot.title = element_text(face = "bold"),
plot.title.position = "plot"
)
坐标轴文本样式
可以修改坐标轴文本的颜色、字体、角度等属性:
g + theme(
axis.text = element_text(
color = "#28a87d",
family = "Tabular",
face = "italic",
angle = 45
)
)
使用scale_*()格式化标签
数值格式化
scales包提供了多种格式化数值标签的方法:
g +
scale_y_continuous(
breaks = 0:4*15000,
labels = scales::comma_format(suffix = " bikes")
)
自定义格式化函数
也可以使用自定义函数格式化标签:
g +
scale_x_continuous(
labels = function(y) paste0(y, "°F"),
name = "Feels Like Temperature"
)
使用ggtext增强文本样式
Markdown样式文本
ggtext包允许在标签中使用Markdown和HTML语法:
g +
ggtitle("<b style='font-family:tabular;font-size:25pt'>TfL</b> bike sharing trends") +
theme(
plot.title = ggtext::element_markdown()
)
处理长标题
对于长标题,可以使用element_textbox_simple实现自动换行:
g +
ggtitle("很长的标题文本...") +
theme(
plot.title = ggtext::element_textbox_simple(
fill = "grey90",
box.color = "grey40"
)
)
分面标签控制
自定义分面标签
labeller参数允许自定义分面标签的显示方式:
codes <- c(
`TRUE` = "Workday",
`FALSE` = "Weekend or Holiday"
)
g +
facet_wrap(
~ is_workday + day_night,
labeller = labeller(
.default = stringr::str_to_title,
is_workday = codes
)
)
添加注释
基本文本注释
使用annotate()添加文本注释:
ggplot(bikes, aes(humidity, temp)) +
geom_point() +
annotate(
geom = "text",
x = 90, y = 27.5,
label = "注释文本",
size = 6, color = "red"
)
添加形状和箭头
可以组合多种注释元素:
ggplot(bikes, aes(humidity, temp)) +
geom_point() +
annotate(
geom = "curve",
x = 90, xend = 82,
y = 25, yend = 18.5,
arrow = arrow(type = "closed")
)
总结
通过合理使用标签和注释,我们可以显著提升数据可视化的表达效果。ggplot2提供了丰富的工具集,从基本的标签设置到高级的注释功能,能够满足各种可视化需求。掌握这些技巧,可以让你的图表更加专业、更具信息量。
记住,好的标签和注释应该:
- 清晰传达信息
- 与图表风格协调
- 不干扰数据本身的展示
- 增强而非分散观众的注意力
通过实践这些技术,你将能够创建出既美观又富有洞察力的数据可视化作品。
登录后查看全文
热门项目推荐
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
最新内容推荐
电脑PC网易云音乐免安装皮肤插件使用指南:个性化音乐播放体验 开源电子设计自动化利器:KiCad EDA全方位使用指南 Jetson TX2开发板官方资源完全指南:从入门到精通 昆仑通态MCGS与台达VFD-M变频器通讯程序详解:工业自动化控制完美解决方案 基恩士LJ-X8000A开发版SDK样本程序全面指南 - 工业激光轮廓仪开发利器 PhysioNet医学研究数据库:临床数据分析与生物信号处理的权威资源指南 QT连接阿里云MySQL数据库完整指南:从环境配置到问题解决 Python案例资源下载 - 从入门到精通的完整项目代码合集 2022美赛A题优秀论文深度解析:自行车功率分配建模的成功方法 TJSONObject完整解析教程:Delphi开发者必备的JSON处理指南
项目优选
收起
deepin linux kernel
C
24
9
Ascend Extension for PyTorch
Python
223
245
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
暂无简介
Dart
672
157
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
662
312
React Native鸿蒙化仓库
JavaScript
262
322
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
64
19
仓颉编译器源码及 cjdb 调试工具。
C++
134
867
仓颉编程语言测试用例。
Cangjie
37
860
openGauss kernel ~ openGauss is an open source relational database management system
C++
160
218