3步快速上手UI-TARS桌面版：智能GUI代理完整指南

2026-02-06 04:59:33作者：咎岭娴Homer

UI-TARS桌面版是一款基于视觉语言模型的智能GUI代理应用程序，能够通过自然语言指令控制您的计算机。本指南将带您从零开始，在短短几分钟内完成UI-TARS桌面版的完整安装配置。

为什么选择UI-TARS桌面版？

传统的计算机操作需要记忆复杂的命令和操作流程，而UI-TARS桌面版彻底改变了这一模式。它结合了最先进的TypeScript技术栈和Electron跨平台框架，让您能够：

🗣️ 用自然语言描述任务，自动执行计算机操作
👁️ 基于屏幕截图进行视觉识别和定位
🖱️ 实现精准的鼠标键盘控制
🔒 完全本地处理，确保数据隐私安全

环境准备与系统要求

在开始安装之前，请确保您的系统满足以下要求：

操作系统：支持Windows、macOS主流版本
浏览器：需要安装Chrome、Edge或Firefox（用于浏览器操作功能）
显示设置：目前仅支持单显示器配置

第一步：获取安装包

您可以通过以下方式获取UI-TARS桌面版的最新安装包：

方式一：直接下载

访问项目发布页面下载最新版本的安装程序。

方式二：源码构建（适合开发者）

如果您希望从源码构建，请执行以下步骤：

# 克隆项目仓库
git clone https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop

# 进入项目目录
cd UI-TARS-desktop

# 安装项目依赖
npm install

# 构建应用程序
npm run build

第二步：安装与权限配置

macOS安装步骤

应用程序安装
- 将下载的UI TARS应用程序拖拽到"应用程序"文件夹中
系统权限配置
- 打开"系统设置" → "隐私与安全性" → "辅助功能"
- 启用UI TARS的辅助功能权限
- 在"屏幕录制"中授权UI TARS访问屏幕内容

首次启动
- 打开UI TARS应用程序
- 您将看到清晰的主界面

Windows安装说明

Windows版本的安装过程更加简单直接，下载后运行安装程序即可。

第三步：模型配置与操作体验

配置视觉语言模型

UI-TARS桌面版支持多种VLM提供商，您可以根据需求选择：

选项一：Hugging Face平台

在Hugging Face平台上部署UI-TARS-1.5模型
获取Base URL、API Key和模型名称
在应用程序设置中进行配置

选项二：火山引擎平台

访问火山引擎Doubao-1.5-UI-TARS页面
点击"立即体验"按钮
通过API接入获取认证信息

开始您的第一个智能任务

完成配置后，您可以：

点击"开始新对话"按钮
选择使用场景（本地计算机或浏览器操作）
输入自然语言指令，开始GUI操作任务

进阶配置与优化建议

性能优化设置

根据您的硬件配置调整VLM参数
选择合适的模型提供商以获得最佳性能
定期检查更新以获取最新功能

常见问题解决

问题1：权限配置失败

解决方案：重新在系统设置中授权，确保所有相关权限都已开启

问题2：模型连接异常

解决方案：检查网络连接，确认API密钥和Base URL配置正确

问题3：操作精度不足

解决方案：调整屏幕缩放设置，确保应用程序在标准分辨率下运行

技术架构深度解析

UI-TARS桌面版采用了现代化的技术架构：

前端框架：基于Vue.js构建用户界面
构建工具：使用Vite实现快速开发和构建
跨平台支持：通过Electron确保在多个操作系统上的一致性体验

下一步学习路径

完成基础安装后，建议您：

阅读设置配置指南，深入了解VLM和聊天参数配置
探索UI-TARS-1.5部署指南，获取最新的部署方法
参与社区讨论，分享您的使用经验和技巧

通过本指南，您已经成功掌握了UI-TARS桌面版的完整安装和配置流程。现在就开始体验智能GUI代理带来的便捷操作吧！

UI-TARS-desktop

A GUI Agent application based on UI-TARS(Vision-Lanuage Model) that allows you to control your computer using natural language.

项目地址：https://gitcode.com/GitHub_Trending/ui/UI-TARS-desktop

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

openJiuwen agent-studio提供零码、低码可视化开发和工作流编排，模型、知识库、插件等各资源管理能力

3步快速上手UI-TARS桌面版：智能GUI代理完整指南

为什么选择UI-TARS桌面版？

环境准备与系统要求