MultiQC v1.29发布：新增Parquet数据输出与多项功能优化

2025-07-03 03:04:45作者：彭桢灵Jeremy

MultiQC是一个用于分析高通量测序数据的工具，它能够将多个分析工具的输出结果汇总成单个交互式报告。作为生物信息学分析流程中常用的质量控制工具，MultiQC极大地简化了研究人员对测序数据质量的评估过程。

核心亮点：Parquet数据输出

在v1.29版本中，MultiQC引入了一项重要的实验性功能——Parquet格式数据输出。这个功能会在每次运行时生成一个multiqc_data/BETA-multiqc.parquet文件，包含了所有绘图和表格数据及其元数据。这项改进为数据分析带来了三个显著优势：

数据重现性：即使没有原始数据，研究人员也能通过这个文件重现MultiQC的分析结果。
跨样本整合：方便将不同样本或不同模块的MultiQC运行结果进行合并分析。
分析数据库构建：特别适合构建分析数据库，用于时间序列分析等高级应用场景。

需要注意的是，由于该功能仍处于测试阶段，其格式在后续版本中可能会有所调整，特别是为了优化OLAP(在线分析处理)集成而进行的改进。

主要功能更新与改进

内容呈现增强

Markdown支持：现在可以在自定义内容中使用Markdown语法，使报告呈现更加灵活多样。
图表副标题定制：新增了图表副标题(如"样本数N")的自定义选项，使报告更具个性化。

人工智能摘要功能增强

支持AWS Bedrock：扩展了AI摘要功能的支持平台，现在可以使用AWS Bedrock服务。
提示词定制：允许用户自定义发送给大型语言模型(LLM)的提示词，提高摘要的相关性。
错误处理优化：改进了从小提琴图生成AI摘要时的格式错误处理机制。

命令行工具改进

新增配置检查命令：multiqc --check-config命令可以帮助用户验证配置文件的有效性。
样本过滤选项：新增--only-samples参数，作为--ignore-samples的反向操作，提供更灵活的样本选择方式。

性能与稳定性

可终止的进程管理：使用可终止进程进行Kaleido图表导出，提高了资源管理效率。
导出超时设置：为图表导出添加了超时机制，防止长时间挂起。

新增分析模块

v1.29版本引入了两个新的分析模块：

Elembio bases2fastq模块：用于分析bases2fastq工具的输出结果。
Elembio cells2stats模块：专门处理cells2stats工具生成的数据。

问题修复与优化

本次版本修复了多个影响用户体验的问题，包括：

临时目录删除失败导致的崩溃问题
日志文件记录不完整的问题
自定义表格标题配置应用问题
时间区域设置错误处理
图表导出功能的各种稳定性问题

特别值得注意的是对AI摘要功能的改进，修复了从小提琴图生成表格时的错误，提高了功能的可靠性。

现有模块更新

多个现有模块也获得了功能增强：

NanoStat模块：现在支持自定义通用统计列
bcftools stats模块：启用了indel图表的对数转换选项
Bases2Fastq模块：增加了对单端测序数据的支持
samtools模块：改进了通用统计列的自定义功能
PRINSEQ++模块：修复了日志警告问题
fastp模块：优化了过滤结果条形图的小数点显示

这些更新进一步提升了MultiQC在各类测序数据分析中的适用性和用户体验。

v1.29版本的发布标志着MultiQC在数据输出格式和功能完整性方面又迈出了重要一步，特别是Parquet格式的支持为下游数据分析开辟了新的可能性。随着AI摘要功能的不断完善和模块生态的持续丰富，MultiQC正逐渐成为生物信息学质量控制领域更加不可或缺的工具。

MultiQC

Aggregate results from bioinformatics analyses across many samples into a single report.

项目地址：https://gitcode.com/gh_mirrors/mul/MultiQC

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

338

185

agent-studio

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

openGauss kernel ~ openGauss is an open source relational database management system

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Python

114

140

MultiQC v1.29发布：新增Parquet数据输出与多项功能优化

核心亮点：Parquet数据输出

主要功能更新与改进

内容呈现增强

人工智能摘要功能增强

命令行工具改进

性能与稳定性

新增分析模块

问题修复与优化

现有模块更新

热门内容推荐

最新内容推荐

项目优选

MultiQC v1.29发布：新增Parquet数据输出与多项功能优化

核心亮点：Parquet数据输出

主要功能更新与改进

内容呈现增强

人工智能摘要功能增强

命令行工具改进

性能与稳定性

新增分析模块

问题修复与优化

现有模块更新

相关内容推荐

热门内容推荐

最新内容推荐

项目优选