2026/6/20 3:45:57
网站建设
项目流程
网站开发人员叫什么,网站的橱窗怎么做,搭建安装wordpress教程,哪个网站做ppt好Open-AutoGLM命令行怎么用#xff1f;main.py参数详解实战教程
Open-AutoGLM – 智谱开源的手机端AI Agent框架
AutoGLM-Phone 是一个基于视觉语言模型的 AI 手机智能助理框架。它能以多模态方式理解屏幕内容#xff0c;并通过 ADB 自动操控设备。用户只需用自然语言下指令…Open-AutoGLM命令行怎么用main.py参数详解实战教程Open-AutoGLM – 智谱开源的手机端AI Agent框架AutoGLM-Phone 是一个基于视觉语言模型的 AI 手机智能助理框架。它能以多模态方式理解屏幕内容并通过 ADB 自动操控设备。用户只需用自然语言下指令如“打开小红书搜美食”模型即可解析意图、理解界面并自动规划、执行操作流程无需手动点击。Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架它能够以多模态方式理解手机屏幕内容并通过自动化操作帮助用户完成任务。系统通过 ADB(Android Debug Bridge)来控制设备以视觉语言模型进行屏幕感知再结合智能规划能力生成并执行操作流程。用户只需用自然语言描述需求如“打开小红书搜索美食”Phone Agent 即可自动解析意图、理解当前界面、规划下一步动作并完成整个流程。系统还内置敏感操作确认机制并支持在登录或验证码场景下进行人工接管。同时它提供远程 ADB 调试能力可通过 WiFi 或网络连接设备实现灵活的远程控制与开发。1. 教程目标与前置知识本教程旨在帮助开发者快速掌握 Open-AutoGLM 的命令行使用方式深入解析main.py的核心参数配置并通过实际案例演示如何部署和运行一个完整的 AI 手机代理任务。1.1 学习目标掌握 Open-AutoGLM 控制端的本地环境搭建理解main.py各关键参数的作用与配置方法实现通过自然语言指令驱动手机完成自动化任务排查常见连接与执行问题1.2 前置知识要求熟悉 Python 基础语法与虚拟环境管理了解 ADBAndroid Debug Bridge基本操作具备基础的命令行使用经验已准备好云服务端模型推理接口如 vLLM 部署的 AutoGLM 模型2. 环境准备与设备连接2.1 硬件与软件环境项目要求操作系统Windows / macOSPython 版本3.10安卓设备Android 7.0 真机或模拟器ADB 工具已安装并配置环境变量ADB 环境配置Windows下载 Android SDK Platform Tools解压后将文件夹路径添加到系统环境变量Path打开命令行输入adb version若返回版本号则表示配置成功。ADB 环境配置macOS在终端中执行以下命令假设 platform-tools 解压至 Downloads 目录export PATH${PATH}:~/Downloads/platform-tools建议将该行写入.zshrc或.bash_profile以永久生效。2.2 手机端设置为确保 ADB 正常通信需完成以下设置开启开发者模式进入「设置」→「关于手机」→ 连续点击「版本号」7次提示“您已进入开发者模式”。启用 USB 调试返回「设置」→「开发者选项」→ 开启「USB 调试」。安装 ADB Keyboard 输入法下载 ADB Keyboard APK 并安装进入「设置」→「语言与输入法」→「默认键盘」→ 切换为 ADB Keyboard作用允许 AI 代理通过 ADB 发送文本输入避免依赖第三方输入法3. 部署 Open-AutoGLM 控制端3.1 克隆代码库并安装依赖# 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 创建虚拟环境推荐 python -m venv venv source venv/bin/activate # Linux/macOS # 或 venv\Scripts\activate # Windows # 安装依赖 pip install -r requirements.txt pip install -e .注意pip install -e .表示以可编辑模式安装包便于后续调试源码。3.2 设备连接方式确保手机通过 USB 或 WiFi 与电脑连接。USB 连接验证adb devices输出示例List of devices attached ABCDEF1234567890 device若显示unauthorized请在手机上确认授权弹窗。WiFi 远程连接推荐用于无线调试使用 USB 连接设备并启动 ADB TCP/IP 模式adb tcpip 5555断开 USB通过 IP 连接adb connect 192.168.x.x:5555替换192.168.x.x为手机局域网 IP可在「设置」→「WLAN」中查看。再次运行adb devices验证连接状态。4. main.py 参数详解与实战调用4.1 核心命令结构python main.py \ --device-id 设备ID或IP:端口 \ --base-url http://服务器IP:端口/v1 \ --model autoglm-phone-9b \ 你的自然语言指令4.2 参数详细说明参数必填说明--device-id✅ADB 设备标识可通过adb devices获取。支持格式ABCDEF123456USB、192.168.1.100:5555WiFi--base-url✅云端模型服务地址必须包含/v1路径。例如http://203.0.113.10:8800/v1--model✅指定调用的模型名称目前仅支持autoglm-phone-9b--max-steps❌最大执行步数默认 20。防止无限循环--temperature❌生成温度控制输出随机性默认 0.7--top-p❌核采样参数默认 0.9--replan-threshold❌规划重试阈值当动作置信度低于此值时重新规划默认 0.5--screenshot-interval❌截图间隔秒用于监控执行过程默认 1.0--enable-confirmation❌是否开启敏感操作确认如支付、删除默认 True4.3 实战调用示例示例 1关注指定抖音号python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://203.0.113.10:8800/v1 \ --model autoglm-phone-9b \ 打开抖音搜索抖音号为dycwo11nt61d 的博主并关注他示例 2查询天气并截图保存python main.py \ --device-id ABCDEF123456 \ --base-url http://localhost:8000/v1 \ --model autoglm-phone-9b \ --max-steps 15 \ 打开天气通 App查看北京未来三天的天气预报并截屏保存示例 3关闭确认机制谨慎使用python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://203.0.113.10:8800/v1 \ --model autoglm-phone-9b \ --enable-confirmation False \ 清理微信缓存并重启应用⚠️警告禁用确认机制可能导致误操作请仅在测试环境中使用。5. Python API 实现远程设备管理除了命令行Open-AutoGLM 提供了 Python API 支持更灵活的集成。5.1 设备连接与管理from phone_agent.adb import ADBConnection, list_devices # 创建 ADB 连接管理器 conn ADBConnection() # 连接远程设备 success, message conn.connect(192.168.1.100:5555) print(f连接状态: {message}) # 列出所有已连接设备 devices list_devices() for device in devices: print(f{device.device_id} - {device.connection_type.value})5.2 启用 TCP/IP 与获取 IP# 在 USB 连接状态下启用无线调试 success, message conn.enable_tcpip(5555) if success: ip conn.get_device_ip() print(f设备 IP: {ip}) else: print(f启用失败: {message})5.3 断开连接conn.disconnect(192.168.1.100:5555)应用场景可用于构建 Web 控制台、CI/CD 测试流水线等自动化系统。6. 常见问题排查指南6.1 连接类问题问题现象可能原因解决方案adb devices无设备显示USB 调试未开启检查手机「开发者选项」中是否启用显示unauthorized未授权电脑在手机上点击“允许USB调试”对话框adb connect失败网络不通或端口未开放确保手机与电脑在同一局域网防火墙放行 5555 端口连接后频繁断开WiFi 不稳定改用 USB 连接或优化路由器信号6.2 模型服务类问题问题现象可能原因解决方案请求超时或连接被拒云服务器防火墙未放行端口使用ufw allow 8800或云平台安全组规则开放返回乱码或空响应vLLM 启动参数不匹配检查--max-model-len是否足够建议 ≥4096显存是否充足模型响应极慢GPU 显存不足或 batch size 过大降低并发请求或升级 GPU 配置6.3 执行异常处理屏幕识别错误尝试调整截图分辨率或增加--screenshot-interval操作卡住检查是否有弹窗遮挡界面可临时启用--max-steps限制输入失败确认 ADB Keyboard 已设为默认输入法7. 总结本文系统讲解了 Open-AutoGLM 的命令行使用方法重点解析了main.py的核心参数配置并提供了从环境搭建、设备连接到实际调用的完整流程。通过本教程你已经掌握了如何配置 ADB 环境并连接安卓设备USB/WiFi如何部署 Open-AutoGLM 控制端并安装依赖main.py各参数的实际意义与调用技巧使用 Python API 实现设备远程管理常见问题的诊断与解决方案Open-AutoGLM 作为一款轻量级、易扩展的手机端 AI Agent 框架适用于自动化测试、辅助交互、远程运维等多种场景。结合强大的视觉语言模型能力开发者可以快速构建“说即做”的智能移动助手。下一步建议尝试将其集成到 CI/CD 流程中或结合 LangChain 构建更复杂的多步骤任务代理。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。