2026/4/18 1:39:32
网站建设
项目流程
做国外夏令营的网站,公司集团网站开发,网页如何制作,郑州做网站的大公司浏览器自动化工具#xff01;开源 AI 浏览器助手让你效率翻倍
前言
在 AI 自动化快速发展的当下#xff0c;浏览器早已不再只是“用来点点点”的工具。越来越多的网页任务——信息抓取、表单填写、跨站流程处理——都开始依赖自动化来提升效率。而最近#xff0c;一款开源的…浏览器自动化工具开源 AI 浏览器助手让你效率翻倍前言在 AI 自动化快速发展的当下浏览器早已不再只是“用来点点点”的工具。越来越多的网页任务——信息抓取、表单填写、跨站流程处理——都开始依赖自动化来提升效率。而最近一款开源的浏览器自动化工具Nanobrowser引起了不少技术圈的关注。它不仅免费、开源还能在本地浏览器中直接运行 AI 自动化流程让网页操作真正做到“像人一样执行”。如果你正在寻找一款安全、灵活、可控的浏览器自动化工具那么它绝对值得一试。Nanobrowser是什么Nanobbrowser 是一款基于浏览器扩展运行的开源 AI 自动化工具定位类似于 OpenAI Operator 的免费替代方案。它的核心理念是让多个 AI 代理协同工作自动完成复杂的网页任务。它的特点非常鲜明核心优势完全免费无需订阅只需使用自己的 LLM API Key。隐私安全所有操作在本地浏览器执行敏感信息不会上传云端。多模型支持兼容 OpenAI、Anthropic、Gemini、Ollama 等多家 LLM。开源透明自动化逻辑完全公开可审计、可扩展。多代理协作Planner 规划、Navigator 执行、Validator 校验流程清晰可控。相比传统的脚本自动化如 SeleniumNanobrowser 更像是“AI 驱动的智能浏览器助手”无需写代码即可完成复杂任务。安装方式三种模式Nanobrowser 提供三种安装方式适合不同用户需求。1. Chrome Web Store推荐适合普通用户安装即用。2. 手动安装最新版本适合想体验最新功能的用户从 GitHub Releases 下载 zip解压后打开 Chrome 浏览器进入chrome://extensions/开启右上角 “开发者模式”点击 “加载已解压的扩展程序”选择解压后的nanobrowser文件夹配置 API Key 和模型即可使用3. 源码构建开发者模式适合二次开发或想深度定制的用户。安装 Node.jsv22.12.0和 pnpmv9.15.1 git clone https://github.com/nanobrowser/nanobrowser.git cd nanobrowser #安装依赖 pnpm install #构建扩展 pnpm build构建结果在dist目录 #加载扩展参考手动安装步骤选择dist文件夹 #开发模式可选 pnpm dev实际使用体验安装完成后只需打开侧栏添加模型服务商即可开始使用。点击“open settings” 添加大模型Windows 下设置 OLLAMA_ORIGINS步骤 1打开系统环境变量按Win S搜索环境变量点击“编辑系统环境变量”在弹出的窗口中点击“环境变量(N)…”步骤 2新增系统变量在“系统变量”区域点击新建变量名OLLAMA_ORIGINS变量值chrome-extension://*点击确定保存。步骤 3重启 Ollama 服务你可以直接重启电脑或者手动重启 OllamaWindows 下设置临时生效)如果你只想当前 PowerShell 会话生效可以用powershell: setx OLLAMA_ORIGINS chrome-extension://*⚠️ 注意setx会写入注册表但不会影响当前窗口需要重新打开 PowerShell 或重启电脑才生效。如何验证是否设置成功打开新的 PowerShellecho $env:OLLAMA_ORIGINSchrome-extension://*说明设置成功。例如输入 搜索“人工智能”AI 会自动分析当前网页结构识别可操作元素自动执行浏览、抓取、整理等步骤最终输出结构化结果整个过程无需你手动点击AI 会像一个熟练的网页操作员一样完成任务。打开闲鱼大模型 ollamaqwen3b:20b给它一个指令“打开闲鱼搜索2T硬盘并得到结果”。改成打开“https://www.goofish.com/” 搜索2T硬盘并得到结果使用大模型 kimi报错你使用的模型不支持 Structured OutputPlanning failed: Failed to invoke gpt-oss:20b with structured output: Could not parse response with structured output例如gpt-oss:20b某些本地模型Ollama某些开源模型Qwen、Llama、Mixtral 的部分版本这些模型能聊天但不能严格按 JSON / Schema 输出导致 Planner 解析失败。解决方案把Planner 模型换成一个支持结构化输出的模型例如GPT-4 系列GPT-4o 系列Claude 3 系列Gemini 2 系列Qwen2.5部分版本支持不要用本地模型当 Planner。Nanobrowser的缺点1.模型兼容性限制明显最大痛点Planner 必须使用支持 Structured Output 的模型本地模型Ollama大多不支持KimiMoonshot不支持大部分开源模型不支持代理 API如 gpt-oss也不完全兼容导致Planner 只能用 GPT-4o / Claude / Gemini 等强模型成本较高。2. Structured Output 错误频发常见报错Could not parse responseInvalid json_schemaUnsupported keywords: $schema这些都来自模型不兼容。总结Nanobrowser 作为一款开源、免费、隐私友好的 AI 浏览器自动化工具正在重新定义网页操作方式。开源地址https://github.com/nanobrowser/nanobrowser它更适合技术用户自动化爱好者需要本地隐私的场景想用 AI 做网页自动化的开发者不太适合完全小白企业级 RPA 场景需要高稳定性的任务无论你是技术爱好者、数据采集人员、运营从业者还是想提升效率的普通用户它都能带来显著的效率提升。如果你想体验真正的 AI 自动化浏览器不妨试试 Nanobrowser。