首页
/ WasmEdge WASI-NN 扩展:支持流式LLM推理的NNRPC实现

WasmEdge WASI-NN 扩展:支持流式LLM推理的NNRPC实现

2025-05-25 00:17:05作者:韦蓉瑛

在WasmEdge项目中,WASI-NN(WebAssembly System Interface for Neural Networks)作为神经网络推理的系统接口标准,近期通过扩展新增了对流式LLM(大语言模型)推理的支持。这项技术突破使得WasmEdge能够更好地服务于生成式AI应用场景。

技术背景

WASI-NN为WebAssembly应用程序提供了标准的神经网络推理接口,主要包括张量(Tensor)、后端(Backend)和图(Graph)等核心抽象概念。传统WASI-NN接口采用批处理模式,即一次性完成整个推理过程并返回完整结果。然而,对于LLM这类生成式模型,流式推理能够显著提升用户体验,允许模型在生成过程中逐步输出结果。

技术实现

WasmEdge团队在WASI-NN规范基础上扩展了三个关键函数:

  1. compute_single:执行单步推理计算,适用于流式生成场景
  2. get_output_single:获取单步推理的输出结果
  3. fini_single:显式释放流式推理上下文资源

这些函数与原有接口的主要区别在于生命周期管理。传统WASI-NN函数会自动管理上下文资源,而流式接口需要显式调用fini_single来释放资源,这为长时间运行的流式推理提供了更精细的控制能力。

NNRPC集成

在NNRPC(Neural Network Remote Procedure Call)实现中,这些新函数通过gRPC协议暴露为远程服务。技术实现要点包括:

  1. 扩展wasi_ephemeral_nn.proto协议定义文件,新增流式函数
  2. 实现对应的RPC服务端处理逻辑
  3. 确保与现有后端(如GGML)的兼容性

实现过程中特别需要注意类型转换的安全性,不正确的类型转换会导致std::bad_cast异常,这也是开发过程中遇到的主要技术挑战之一。

应用价值

这项技术扩展为WasmEdge带来了重要的能力提升:

  1. 实时性:LLM应用可以即时显示生成结果,无需等待完整生成
  2. 资源效率:细粒度的资源控制优化了长时间推理场景
  3. 分布式部署:通过NNRPC实现计算加速与客户端的分离

这项改进使得WasmEdge在AI推理领域,特别是需要流式处理的LLM应用场景中,具备了更强的竞争力。开发者现在可以利用这些接口构建更响应迅速、用户体验更好的生成式AI应用。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
176
261
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
860
511
ShopXO开源商城ShopXO开源商城
🔥🔥🔥ShopXO企业级免费开源商城系统,可视化DIY拖拽装修、包含PC、H5、多端小程序(微信+支付宝+百度+头条&抖音+QQ+快手)、APP、多仓库、多商户、多门店、IM客服、进销存,遵循MIT开源协议发布、基于ThinkPHP8框架研发
JavaScript
93
15
openGauss-serveropenGauss-server
openGauss kernel ~ openGauss is an open source relational database management system
C++
129
182
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
259
300
kernelkernel
deepin linux kernel
C
22
5
cherry-studiocherry-studio
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
595
57
CangjieCommunityCangjieCommunity
为仓颉编程语言开发者打造活跃、开放、高质量的社区环境
Markdown
1.07 K
0
HarmonyOS-ExamplesHarmonyOS-Examples
本仓将收集和展示仓颉鸿蒙应用示例代码,欢迎大家投稿,在仓颉鸿蒙社区展现你的妙趣设计!
Cangjie
398
371
Cangjie-ExamplesCangjie-Examples
本仓将收集和展示高质量的仓颉示例代码,欢迎大家投稿,让全世界看到您的妙趣设计,也让更多人通过您的编码理解和喜爱仓颉语言。
Cangjie
332
1.08 K