FriendsDontLetFriends 项目教程

2024-09-18 21:35:01作者：冯梦姬Eddie

1. 项目介绍

FriendsDontLetFriends 是一个关于数据可视化最佳实践和常见错误的教育项目。该项目由 Chenxin Li 创建，旨在帮助数据科学家和研究人员避免在数据可视化过程中犯下常见的错误。项目内容包括一系列关于如何正确使用不同类型的图表和避免常见陷阱的教程。

2. 项目快速启动

环境准备

在开始之前，请确保你已经安装了以下软件：

R 语言
RStudio
rmarkdown 包

你可以通过以下命令安装 rmarkdown 包：

install.packages("rmarkdown")

克隆项目

首先，克隆项目到本地：

git clone https://github.com/cxli233/FriendsDontLetFriends.git

运行示例代码

进入项目目录并运行示例代码：

cd FriendsDontLetFriends
Rscript -e "rmarkdown::render('Scripts/Heatmap_tutorial.Rmd')"

这将生成一个关于热图的教程文档。

3. 应用案例和最佳实践

案例1：避免使用条形图进行均值分离

在科学出版物中，条形图常用于展示均值和数据分布。然而，条形图并不适合展示均值分离，尤其是在数据分布差异较大的情况下。

最佳实践：使用箱线图或小提琴图来展示数据的分布和均值。

案例2：避免在小样本中使用小提琴图

小提琴图（Violin Plot）在小样本中可能会误导读者，因为小样本的分布和四分位数可能会变化很大。

最佳实践：在小样本中使用箱线图或点图来展示数据分布。

案例3：避免使用双向颜色尺度表示单向数据

在热图或颜色渐变图中，使用双向颜色尺度（如红-绿）来表示单向数据（如正值）可能会导致误解。

最佳实践：使用单向颜色尺度（如蓝色）来表示正值数据。

4. 典型生态项目

生态项目1：Galaxy Training Network

Galaxy Training Network 是一个提供在线培训材料的开放资源库，专注于实践培训，旨在直接应用于学习者。该项目与 FriendsDontLetFriends 项目结合，可以帮助研究人员更好地理解和应用数据可视化的最佳实践。

生态项目2：ggplot2

ggplot2 是 R 语言中一个强大的数据可视化包，广泛用于科学研究和数据分析。FriendsDontLetFriends 项目中的许多示例和教程都使用了 ggplot2 来展示如何正确地进行数据可视化。

通过结合这些生态项目，研究人员可以更全面地理解和应用数据可视化的最佳实践。

FriendsDontLetFriends

Friends don't let friends make certain types of data visualization - What are they and why are they bad.

项目地址：https://gitcode.com/gh_mirrors/fr/FriendsDontLetFriends

登录后查看全文

项目优选

收起

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

457

446

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

152

254