Handy跨平台部署教程:Windows/macOS/Linux全平台适配指南
你是否正在寻找一款完全离线运行的语音转文字工具?Handy作为一款免费开源的语音转文本应用,支持全平台离线运行,本文将详细介绍如何在Windows、macOS和Linux系统上部署Handy,让你轻松实现本地语音识别。
准备工作:环境配置与依赖安装
全平台通用依赖
Handy基于Rust和Web技术栈构建,所有平台都需要安装以下基础依赖:
- Rust (最新稳定版)
- Bun 包管理器
- Tauri框架依赖:按照Tauri官方前置要求配置
项目构建配置文件:BUILD.md
项目依赖清单:package.json
平台专属依赖
Windows系统
- Microsoft C++ Build Tools
- Visual Studio 2019/2022(需安装C++开发组件)
- 或直接安装Visual Studio Build Tools 2019/2022
macOS系统
- Xcode命令行工具:
xcode-select --install
Linux系统
根据不同发行版安装相应依赖:
# Ubuntu/Debian
sudo apt update
sudo apt install build-essential libasound2-dev pkg-config libssl-dev libvulkan-dev vulkan-tools glslc libgtk-3-dev libwebkit2gtk-4.1-dev libayatana-appindicator3-dev librsvg2-dev patchelf
# Fedora/RHEL
sudo dnf groupinstall "Development Tools"
sudo dnf install alsa-lib-devel pkgconf openssl-devel vulkan-devel gtk3-devel webkit2gtk4.1-devel libappindicator-gtk3-devel librsvg2-devel
# Arch Linux
sudo pacman -S base-devel alsa-lib pkgconf openssl vulkan-devel gtk3 webkit2gtk-4.1 libappindicator-gtk3 librsvg
源代码获取与项目构建
1. 克隆代码仓库
git clone https://gitcode.com/GitHub_Trending/handy11/Handy.git
cd Handy
2. 安装项目依赖
使用Bun安装前端依赖:
bun install
项目依赖配置:package.json
3. 构建配置解析
Handy的构建过程由Tauri框架管理,主要配置文件为src-tauri/tauri.conf.json,关键配置项包括:
- 构建命令:
beforeBuildCommand执行前端资源构建 - 前端资源目录:
frontendDist指定为../dist - 应用窗口设置:默认宽680px、高510px,不可最大化
- 打包配置:支持Windows、macOS和Linux全平台打包
平台专属构建步骤
Windows平台构建
- 安装Visual Studio Build Tools 2019/2022(确保勾选"C++构建工具")
- 执行构建命令:
bun run tauri build
- 构建产物位于
src-tauri/target/release/bundle/msi/目录下,格式为.msi安装包
macOS平台构建
- 安装Xcode命令行工具:
xcode-select --install
- 执行构建命令:
bun run tauri build
- 构建产物位于
src-tauri/target/release/bundle/dmg/目录下,格式为.dmg镜像文件
macOS特定配置:在src-tauri/tauri.conf.json中设置了macOSPrivateApi: true以支持高级音频功能
Linux平台构建
- 安装对应发行版的构建依赖(详见前文"平台专属依赖"部分)
- 执行构建命令:
bun run tauri build
- 构建产物位于
src-tauri/target/release/bundle/目录下,包含AppImage、deb、rpm等多种格式
开发环境配置(可选)
如果你需要参与Handy的开发工作,可以使用开发模式运行应用:
bun run tauri dev
开发模式配置:在src-tauri/tauri.conf.json中设置了beforeDevCommand: "bun run dev"和开发服务器地址http://localhost:1420
常见问题解决
构建失败:缺少系统依赖
确保已安装所有平台特定依赖,特别是Linux系统需要的alsa、gtk和webkit2gtk库。参考BUILD.md中的"Platform-Specific Requirements"部分。
运行时错误:模型文件缺失
Handy需要VAD(语音活动检测)模型才能正常工作,构建过程中会自动下载必要的模型文件。如果遇到模型缺失错误,请检查网络连接或手动下载模型文件放置到指定目录。
权限问题:麦克风访问失败
- Windows:在应用设置中启用麦克风权限
- macOS:在系统偏好设置>安全性与隐私中授予麦克风访问权限
- Linux:确保用户属于audio组,或使用
pactl命令检查音频设备权限
总结与后续步骤
通过本文指南,你已成功在Windows、macOS或Linux系统上部署了Handy应用。Handy的离线语音识别功能为你提供隐私安全的语音转文字体验。
接下来你可以:
- 探索Handy的设置界面,自定义快捷键和转录选项
- 尝试不同的语音模型以获得更好的识别效果
- 参与Handy的开源开发,提交Issue或Pull Request
项目贡献指南:参考README.md了解如何参与项目开发
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
KuiklyUI基于KMP技术的高性能、全平台开发框架,具备统一代码库、极致易用性和动态灵活性。 Provide a high-performance, full-platform development framework with unified codebase, ultimate ease of use, and dynamic flexibility. 注意:本仓库为Github仓库镜像,PR或Issue请移步至Github发起,感谢支持!Kotlin08
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00