2026/4/18 7:20:45
网站建设
项目流程
河南省建设工程造价协会网站,网页跳转到别的网站,宁波seo网络推广服务商,网站服务公司有哪些Open-AutoGLM部署教程#xff1a;Python API远程调用详细步骤
1. 技术背景与应用场景
随着多模态大模型的发展#xff0c;AI智能体在移动端的应用逐渐成为研究热点。Open-AutoGLM 是由智谱开源的手机端 AI Agent 框架#xff0c;基于视觉语言模型#xff08;VLM#xff…Open-AutoGLM部署教程Python API远程调用详细步骤1. 技术背景与应用场景随着多模态大模型的发展AI智能体在移动端的应用逐渐成为研究热点。Open-AutoGLM 是由智谱开源的手机端 AI Agent 框架基于视觉语言模型VLM实现对安卓设备的自动化操作。该框架能够理解用户以自然语言形式下达的任务指令如“打开小红书搜索美食”并结合屏幕图像识别、语义解析和动作规划能力自动完成点击、滑动、输入等交互行为。其核心组件 Phone Agent 构建于 AutoGLM-Phone 之上通过 ADBAndroid Debug Bridge与设备通信利用多模态感知技术实时分析手机界面内容并生成可执行的操作序列。系统支持本地控制与远程调用两种模式尤其适合需要长期运行或跨网络环境调试的场景。此外为保障安全性系统内置敏感操作确认机制在涉及登录、支付或验证码输入时可暂停执行交由人工接管。本教程将重点介绍如何部署 Open-AutoGLM 控制端并通过 Python API 实现对远程设备的连接与任务调度帮助开发者快速搭建可扩展的移动端自动化测试或辅助系统。2. 环境准备与依赖配置2.1 硬件与软件要求为确保 Open-AutoGLM 正常运行需满足以下基础环境条件操作系统Windows 10/11 或 macOS 10.15Python 版本建议使用 Python 3.10 或更高版本安卓设备Android 7.0 及以上系统的真机或模拟器ADB 工具包用于设备连接与命令下发2.2 安装并配置 ADBADB 是 Android SDK 的一部分负责主机与安卓设备之间的通信。以下是不同平台下的安装与配置方法。Windows 平台配置步骤下载 Android Platform Tools 压缩包。解压至本地目录例如C:\platform-tools。打开“运行”窗口Win R输入sysdm.cpl进入“系统属性”。点击“高级”选项卡 → “环境变量” → 在“系统变量”中找到Path。添加新条目C:\platform-tools。打开命令提示符执行adb version若返回版本信息则表示配置成功。macOS 平台配置方法假设解压后的文件位于~/Downloads/platform-tools可在终端中执行以下命令添加路径export PATH${PATH}:~/Downloads/platform-tools为永久生效可将上述命令写入 shell 配置文件如.zshrc或.bash_profileecho export PATH${PATH}:~/Downloads/platform-tools ~/.zshrc source ~/.zshrc验证方式同上使用adb version查看输出。3. 手机端设置与权限开启3.1 开启开发者选项与 USB 调试进入手机“设置” → “关于手机”。连续点击“版本号”7次直到提示“您已进入开发者模式”。返回设置主界面进入“开发者选项”。启用“USB 调试”功能。注意部分厂商可能隐藏此菜单需在“更多设置”或“系统更新”中查找。3.2 安装 ADB Keyboard 输入法由于自动化过程中无法依赖物理键盘输入文字需借助虚拟输入法实现文本注入。下载 ADB Keyboard APK 并安装到目标设备。进入“设置” → “语言与输入法” → “默认键盘”。选择“ADB Keyboard”作为当前输入法。安装完成后可通过 ADB 命令发送文本adb shell am broadcast -a ADB_INPUT_TEXT --es msg Hello World若屏幕上弹出输入框并显示对应文字则说明配置成功。4. 部署 Open-AutoGLM 控制端代码4.1 克隆项目仓库在本地电脑上打开终端执行以下命令获取 Open-AutoGLM 源码git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM4.2 安装 Python 依赖项目依赖多个第三方库包括 PyTorch、transformers、Pillow 和 fastapi 等。建议在虚拟环境中进行安装python -m venv venv source venv/bin/activate # Linux/macOS # 或 venv\Scripts\activate.bat Windows安装依赖项pip install -r requirements.txt pip install -e .其中-e .表示以可编辑模式安装当前包便于后续开发调试。5. 设备连接方式详解5.1 USB 连接方式最稳定的连接方式是通过 USB 数据线直连。使用数据线连接手机与电脑。手机端弹出“允许 USB 调试”对话框时点击“允许”。在终端执行adb devices输出应类似List of devices attached 1234567890ABCDEF device若未显示设备请检查 USB 接口、数据线质量及驱动是否正常。5.2 WiFi 远程连接方式对于远程调试或无线部署场景推荐使用 ADB over TCP/IP。步骤一启用 TCP/IP 模式首先通过 USB 连接设备然后执行adb tcpip 5555该命令将 ADB 监听端口设为 5555。步骤二断开 USB通过 IP 连接获取手机局域网 IP 地址可在“设置”→“WLAN”中查看例如192.168.1.100然后执行adb connect 192.168.1.100:5555再次运行adb devices应能看到设备以 TCP 连接方式列出。提示重启手机后需重新执行adb tcpip 5555否则连接失效。6. 启动 AI 代理与任务执行6.1 命令行方式启动任务当服务端模型已部署完毕如运行在云服务器上的 vLLM 服务可通过命令行直接触发任务。python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://云服务器公网IP:8800/v1 \ --model autoglm-phone-9b \ 打开抖音搜索抖音号为dycwo11nt61d 的博主并关注他参数说明--device-id设备标识可通过adb devices获取。--base-url云端推理服务地址格式为http://IP:PORT/v1。--model指定使用的模型名称需与服务端注册名一致。最后字符串用户的自然语言指令。程序会自动截取屏幕、上传至模型服务、接收动作指令并执行相应 ADB 操作。6.2 使用 Python API 进行远程控制除了命令行Open-AutoGLM 提供了完整的 Python API便于集成到其他系统中。示例代码设备连接管理from phone_agent.adb import ADBConnection, list_devices # 创建 ADB 连接管理器 conn ADBConnection() # 连接远程设备 success, message conn.connect(192.168.1.100:5555) print(f连接状态: {message}) # 列出所有已连接设备 devices list_devices() for device in devices: print(f{device.device_id} - {device.connection_type.value}) # 可选为 USB 设备启用 TCP/IP 模式 success, message conn.enable_tcpip(5555) if success: ip conn.get_device_ip() print(f设备 IP: {ip}) else: print(f启用 TCP/IP 失败: {message}) # 断开指定设备 conn.disconnect(192.168.1.100:5555)核心功能说明connect()建立与设备的 ADB 连接支持 IP:PORT 形式。list_devices()获取当前所有连接的设备列表。enable_tcpip(port)将设备切换至网络调试模式。get_device_ip()查询设备当前的局域网 IP。disconnect()安全断开连接。这些接口可用于构建动态设备池管理系统适用于大规模自动化测试平台。7. 常见问题与排查指南7.1 连接失败Connection Refused现象adb connect返回failed to connect。原因与解决方案云服务器防火墙未开放对应端口如 8800。请检查安全组规则放行所需端口。ADB 服务未正确监听 TCP 端口。确认执行了adb tcpip 5555。设备与电脑不在同一局域网内。请确保两者处于相同 WiFi 网络。7.2 ADB 频繁掉线现象连接中断设备状态变为offline。可能原因WiFi 信号不稳定建议改用 USB 连接。手机休眠导致 ADB 断开。可在“开发者选项”中关闭“USB 调试超时”或保持屏幕常亮。多个 ADB 客户端争抢连接。确保只有一个进程在使用 ADB。7.3 模型响应异常或乱码现象AI 返回无效动作、字符编码错误或长时间无响应。排查方向检查vLLM启动参数是否包含正确的--max-model-len和显存分配。确认模型服务返回的是标准 JSON 格式字段结构符合预期。查看日志是否有 OOM内存溢出或 CUDA 错误。7.4 敏感操作未拦截现象AI 自动执行了支付或删除操作。建议措施启用内置的“敏感操作确认机制”在配置文件中设置关键词白名单。对涉及金融类 App 设置手动接管策略。定期审查动作日志增强审计能力。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。