DroidRun:让移动设备听懂你的语言,开启自动化新篇章
DroidRun是一款革命性的开源框架,它赋予您用自然语言命令控制Android和iOS设备的能力。无论您是需要自动化测试流程的开发者、负责设备管理的IT人员,还是希望简化日常操作的普通用户,这款工具都能将您的设备交互效率提升数倍。就像给设备安装了智能大脑,从此告别繁琐的手动操作,让设备真正听懂并执行您的指令。
诊断移动操作痛点
在数字化时代,我们每天与移动设备的交互充满了重复与低效:测试工程师需要反复执行相同的UI测试步骤,IT管理员要为多台设备配置相同的设置,普通用户则在各类应用间进行机械性的切换操作。这些重复劳动不仅消耗时间,还容易因人为失误导致结果偏差。传统的自动化工具要么需要编写复杂代码,要么功能局限于特定场景,无法满足多样化的自然语言交互需求。
构建自动化环境
系统准备清单
在开始DroidRun之旅前,请确保您的系统满足以下条件:
- Python 3.11或更高版本(确保语言运行环境支持)
- 已启用开发者模式的Android设备(通过USB或Wi-Fi连接)
- 稳定的网络环境(用于下载依赖和连接LLM服务)
安装核心框架
使用pip命令一键安装DroidRun及其所有扩展组件:
pip install 'droidrun[google,anthropic,openai,deepseek,ollama,dev]' // 安装核心框架及多LLM支持
这条命令会自动配置DroidRun的核心功能,同时安装对Google Gemini、Anthropic Claude、OpenAI GPT等主流语言模型的支持,让您可以根据需求选择最合适的AI大脑。
获取项目资源
克隆项目仓库以获取必要的配置文件和移动应用:
git clone https://gitcode.com/gh_mirrors/dr/droidrun // 克隆项目代码库 cd droidrun // 进入项目目录
配置设备连接通道
启用开发者选项
要让计算机与Android设备建立通信,首先需要开启设备的开发者模式:
- 进入设备"设置" > "关于手机"
- 连续点击"版本号"7次激活开发者选项
- 返回设置主菜单,找到并进入"开发者选项"
调试模式设置
在开发者选项中启用以下关键设置:
- ✅ USB调试(允许计算机通过USB控制设备)
- ✅ 允许USB安装应用(便于安装DroidRun配套程序)
- ✅ USB调试(安全设置)(允许通过USB进行敏感操作)
⚠️ 安全提示:仅在信任的计算机上启用这些选项,完成配置后可暂时关闭以保障设备安全。
安装Portal控制应用
DroidRun需要在设备上安装专用的Portal应用作为控制中枢:
- 连接设备到计算机后,确保已启用文件传输模式
- 将项目中的Portal APK文件传输到设备
- 在设备上找到并安装该应用(可能需要允许"未知来源"安装)
DroidRun Portal应用界面,显示无障碍服务开关、数据测试按钮和覆盖层控制等核心功能区域
激活智能交互能力
配置无障碍服务
无障碍服务是DroidRun实现自动化操作的核心:
- 打开已安装的DroidRun Portal应用
- 找到"Accessibility Service"选项,点击右侧"ENABLE"按钮
- 在系统弹出的无障碍服务列表中,找到DroidRun并启用
- 确认授予必要权限(这将允许应用模拟用户操作)
验证连接状态
使用Portal应用的测试功能验证设备配置是否正确:
- 在应用主界面找到"TEST FETCHING DATA"按钮
- 点击按钮后观察状态变化
- 成功连接会显示设备信息和交互状态
自然语言控制演示
现在您可以通过命令行使用自然语言控制设备:
droidrun "打开设置应用并进入网络配置" // 启动系统设置并导航到网络页面
droidrun "在浏览器中搜索最新科技新闻" // 启动浏览器并执行搜索
droidrun "拍摄一张照片并保存到云端" // 调用相机应用并自动上传
探索行业应用案例
移动应用测试自动化
场景:某应用开发团队需要每天验证20个关键功能点 解决方案:使用DroidRun创建自然语言测试脚本
droidrun "启动应用,登录测试账号,验证首页加载时间,检查用户资料显示"
价值:将每日测试时间从2小时缩短至15分钟,错误率降低80%
企业设备管理
场景:IT管理员需要为50台设备统一配置安全策略 解决方案:编写批量操作指令
droidrun "为所有设备启用自动锁屏,设置密码策略,安装安全证书"
价值:配置时间从逐台操作的8小时减少到10分钟,确保配置一致性
残障人士辅助工具
场景:视力障碍用户需要独立操作智能手机 解决方案:语音转自然语言指令
droidrun "读取屏幕内容,告诉我有哪些未读消息"
droidrun "发送短信给家人:我将在30分钟后到家"
价值:帮助残障用户实现设备独立操作,提升生活自主性
扩展DroidRun能力
多模型配置
DroidRun支持根据任务类型选择最合适的语言模型:
- 本地部署:使用Ollama运行Llama等模型,保护数据隐私
- 云端服务:接入OpenAI或Google Gemini获取更强推理能力
- 混合模式:简单指令用本地模型,复杂任务调用云端API
配置文件位于项目的droidrun/config_example.yaml,您可以复制为config.yaml后进行个性化设置。
自定义自动化流程
通过组合自然语言指令,您可以创建复杂的自动化工作流:
droidrun "每天早上7点打开天气应用,播报天气情况,然后打开日历应用显示今日日程"
社区与资源
DroidRun拥有活跃的开发者社区,您可以通过以下方式获取支持:
- 项目文档:查看
docs/目录下的详细指南 - 示例脚本:参考
examples/目录中的使用案例 - 问题反馈:通过项目仓库的Issue系统提交建议
DroidRun品牌标志,代表着自然语言与移动设备的无缝连接
通过DroidRun,您的移动设备不再只是被动执行操作的工具,而成为了能够理解复杂指令、自主完成任务的智能助手。无论是提升工作效率、简化测试流程,还是创造无障碍使用体验,DroidRun都能为您打开移动自动化的全新可能。现在就开始探索,让您的设备真正听懂并实现您的想法。
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5-w4a8GLM-5-w4a8基于混合专家架构,专为复杂系统工程与长周期智能体任务设计。支持单/多节点部署,适配Atlas 800T A3,采用w4a8量化技术,结合vLLM推理优化,高效平衡性能与精度,助力智能应用开发Jinja00
jiuwenclawJiuwenClaw 是一款基于openJiuwen开发的智能AI Agent,它能够将大语言模型的强大能力,通过你日常使用的各类通讯应用,直接延伸至你的指尖。Python0243- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
AtomGit城市坐标计划AtomGit 城市坐标计划开启!让开源有坐标,让城市有星火。致力于与城市合伙人共同构建并长期运营一个健康、活跃的本地开发者生态。01
electerm开源终端/ssh/telnet/serialport/RDP/VNC/Spice/sftp/ftp客户端(linux, mac, win)JavaScript00