PMwCAS 项目使用教程
2024-09-19 05:00:30作者:平淮齐Percy
1. 项目介绍
PMwCAS(Persistent Multi-Word Compare-and-Swap)是一个用于在非易失性内存(NVRAM)上原子地更改多个8字节字的库。它允许开发者轻松构建无锁数据结构,并且不需要应用程序自定义恢复逻辑。PMwCAS的核心概念是描述符(descriptor),通过描述符可以实现对多个目标字的高效原子操作。
PMwCAS支持Windows和Linux操作系统,并提供了四种不同的持久化模式:
- 使用Intel PMDK进行持久化
- 通过DRAM模拟持久化
- 非持久化(无持久化支持)
- 使用Intel TSX进行非持久化(通过硬件事务内存安装描述符)
2. 项目快速启动
2.1 环境准备
在开始之前,请确保您的系统满足以下要求:
- 操作系统:Windows(CMake + Visual Studio)或 Linux(CMake + gcc/clang)
- 依赖库:Intel PMDK(如果使用持久化模式)
2.2 克隆项目
首先,克隆PMwCAS项目到本地:
git clone --recursive https://github.com/microsoft/pmwcas.git
2.3 编译项目
2.3.1 在Linux上编译
假设我们在源代码目录下创建一个名为build的目录进行编译:
mkdir build
cd build
cmake -DPMEM_BACKEND=[PMDK/Volatile/Emu] -DCMAKE_BUILD_TYPE=[Debug/Release/RelWithDebInfo] ..
make -jN
2.3.2 在Windows上编译
在Windows上编译时,使用以下命令:
md build
cd build
cmake -G [generator] ..
其中,[generator]应与已安装的Visual Studio版本匹配,例如Visual Studio 14 2015 Win64。然后,可以通过打开pmwcas.sln文件在Visual Studio中进行编译,或者使用以下命令:
msbuild pmwcas.sln /p:Configuration=[Release/Debug]
3. 应用案例和最佳实践
3.1 数组基准测试
PMwCAS提供了一个数组基准测试,用于原子地更改固定大小的数组中的随机数量的条目。以下是一个示例命令:
mwcas_shm_server -shm_segment "mwcas" # 启动共享内存进程
mwcas_benchmark -shm_segment "mwcas" -threads 2 -seconds 10 -array_size 100 -word_count 4
3.2 双链表
PMwCAS还提供了使用单字CAS和PMwCAS实现的无锁双链表。以下是一个示例命令:
mwcas_shm_server -shm_segment "mwcas" # 启动共享内存进程
doubly_linked_list_benchmark -shm_segment "mwcas" -threads 2 -seconds 10
4. 典型生态项目
PMwCAS可以与其他高性能计算和存储项目结合使用,例如:
- Intel PMDK:用于持久化内存编程的库,与PMwCAS结合使用可以实现高效的持久化数据结构。
- TBB(Threading Building Blocks):Intel提供的并行编程库,可以与PMwCAS结合使用以提高多线程性能。
- SPDK(Storage Performance Development Kit):用于构建高性能存储应用的库,可以与PMwCAS结合使用以实现高效的存储系统。
通过结合这些生态项目,PMwCAS可以进一步扩展其应用场景,提供更强大的功能和性能。
登录后查看全文
热门项目推荐
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00
项目优选
收起
deepin linux kernel
C
24
9
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
405
3.14 K
Ascend Extension for PyTorch
Python
226
251
暂无简介
Dart
672
159
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
663
319
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.21 K
657
React Native鸿蒙化仓库
JavaScript
262
325
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
openGauss kernel ~ openGauss is an open source relational database management system
C++
160
220
仓颉编译器源码及 cjdb 调试工具。
C++
135
868