2026/4/18 6:43:11
网站建设
项目流程
网站开发与设计需要哪些技术,深圳互联网网站建设,沈阳网站建设策划,工商网企业信息查询系统营业执照简介
Skyvern 是一个开源的AI驱动浏览器自动化平台#xff0c;利用大语言模型#xff08;LLM#xff09;和计算机视觉技术来自动化基于浏览器的工作流程。该项目由Skyvern-AI团队开发#xff0c;采用AGPL-3.0开源许可证#xff0c;旨在替代传统脆弱的浏览器自动化解决…简介Skyvern 是一个开源的AI驱动浏览器自动化平台利用大语言模型LLM和计算机视觉技术来自动化基于浏览器的工作流程。该项目由Skyvern-AI团队开发采用AGPL-3.0开源许可证旨在替代传统脆弱的浏览器自动化解决方案提供更智能、更健壮的自动化能力。核心价值AI驱动结合LLM和计算机视觉智能理解网页内容并执行操作无需编码通过自然语言描述任务无需编写复杂的XPath或CSS选择器抗布局变化基于视觉理解而非DOM结构适应网站布局变化多网站适配同一工作流可应用于多个相似网站提高复用性技术特色Skyvern采用任务驱动的自主智能体设计受到BabyAGI和AutoGPT的启发但增加了与网站交互的能力。它使用智能体群来理解网站规划并执行动作能够处理从未见过的网站并对网站布局变化具有强鲁棒性。主要功能1. 智能网页理解与交互Skyvern通过视觉LLM技术理解网页内容能够识别按钮、表单、链接等交互元素并执行点击、输入、滚动等操作。相比传统基于DOM解析的方法Skyvern基于视觉理解不依赖易变的XPath或CSS选择器大大提高了自动化脚本的稳定性。2. 复杂工作流编排支持构建复杂的工作流包括条件判断、循环、数据提取、文件操作等。可以串联多个任务形成完整业务流程如登录→导航→数据提取→下载→邮件发送的全流程自动化。3. 多模态任务执行整合文本理解和视觉识别能力处理包含图片、图表等非文本内容的网页。支持表单自动填写、文件上传下载、验证码处理等复杂场景。4. 实时监控与调试提供浏览器视口实时流传输功能用户可以实时查看Skyvern的操作过程。内置完善的调试工具支持任务中断、手动干预、步骤重试等调试功能。5. 多种认证集成支持多种身份验证方式包括用户名密码、双因素认证2FA、OAuth等。集成主流密码管理器确保凭证安全存储和使用。6. 多LLM提供商支持支持OpenAI、Anthropic、Azure OpenAI、AWS Bedrock、Gemini、Ollama等多种大语言模型提供商用户可根据需求灵活选择。安装与配置环境要求系统要求操作系统Windows、macOS、LinuxPython 3.8及以上版本Docker和Docker Compose容器化部署现代浏览器Chrome推荐硬件要求内存建议8GB以上存储空间至少2GB可用空间网络稳定的互联网连接安装步骤方式一pip安装推荐# 安装Skyvern pip install skyvern # 快速启动包含数据库初始化等 skyvern quickstart方式二Docker Compose部署# 克隆项目 git clone https://github.com/Skyvern-AI/skyvern.git cd skyvern # 生成环境配置文件 skyvern init llm # 启动服务 docker compose up -d方式三从源码安装# 安装uv包管理器 curl -LsSf https://astral.sh/uv/install.sh | sh # 创建虚拟环境并安装依赖 uv sync --group dev # 初始化服务 uv run skyvern quickstart配置说明LLM提供商配置在.env文件中配置选择的LLM提供商API密钥# OpenAI配置示例 ENABLE_OPENAItrue OPENAI_API_KEYsk-your-api-key LLM_KEYOPENAI_GPT4O # 或使用本地Ollama ENABLE_OLLAMAtrue OLLAMA_SERVER_URLhttp://localhost:11434 OLLAMA_MODELqwen2.5:7b-instruct服务配置Web界面端口默认8080API服务端口默认8000数据库PostgreSQL默认端口5432如何使用基础使用通过Python SDK使用安装Skyvern Python包后可以通过几行代码启动自动化任务from skyvern import Skyvern # 连接到Skyvern服务 skyvern Skyvern.local() # 运行自动化任务 task await skyvern.run_task( prompt登录邮箱下载最新的发票文件, urlhttps://mail.example.com ) print(f任务完成{task.result})通过Web界面使用启动服务后访问http://localhost:8080在Web界面中输入目标网址用自然语言描述要执行的任务点击运行实时查看执行过程查看执行结果和下载的文件高级功能工作流编排对于复杂业务流程可以创建多步骤工作流workflow await skyvern.create_workflow( name月度财务对账, steps[ {action: login, target: 财务系统}, {action: download, target: 月度报表}, {action: extract, target: 关键数据}, {action: email, target: 发送给财务主管} ] )数据提取模式指定数据结构确保输出格式一致task await skyvern.run_task( prompt提取产品价格和库存信息, data_extraction_schema{ type: object, properties: { products: { type: array, items: { type: object, properties: { name: {type: string}, price: {type: number}, stock: {type: integer} } } } } } )文件处理自动处理文件下载和上传# 下载文件并保存到指定位置 await task.download_file(invoice.pdf, /path/to/save/) # 上传文件到表单 await task.upload_file(/path/to/file.pdf, 请选择文件)集成部署与现有系统集成Skyvern提供REST API可以轻松集成到现有系统中import requests response requests.post( http://localhost:8000/tasks, json{ prompt: 每日数据抓取任务, url: https://target-website.com }, headers{Authorization: Bearer your-api-key} )计划任务结合cron或Celery实现定时自动化# 每天上午9点执行任务 from celery.schedules import crontab app.conf.beat_schedule { daily-report: { task: skyvern.tasks.run_automation, schedule: crontab(hour9, minute0), args: (生成每日销售报告, https://crm.example.com) }, }应用场景实例实例1企业财务自动化对账场景描述某跨国公司需要每月从10个不同银行网站下载对账单手动操作需要财务人员2-3天时间且容易出错。解决方案使用Skyvern构建自动化对账工作流。系统每天自动登录各银行网站下载最新对账单提取关键数据并生成统一格式的报告。支持多因素认证确保账户安全。遇到验证码时自动暂停等待人工干预。实施效果对账时间从3天缩短到2小时错误率降低95%数据准确性显著提升财务人员可专注于数据分析而非重复操作支持7×24小时自动运行节假日无休实例2电商价格监控与竞争分析场景描述某电商企业需要监控主要竞争对手的价格策略传统方式依赖人工抽查覆盖范围有限且不及时。解决方案部署Skyvern价格监控系统自动遍历竞争对手商品页面提取价格、库存、促销信息。发现价格异常时自动预警支持多平台数据对比分析。基于视觉识别适应各电商网站不同的页面布局。实施效果监控商品数量从100个扩展到10,000个价格更新频率从每日提升到实时发现竞争对手调价后5分钟内发出预警数据准确性达到99.8%支持精准决策实例3政府服务在线申报场景描述企业需要定期向多个政府网站提交申报材料流程复杂且各网站界面不统一人工操作容易出错。解决方案使用Skyvern实现政府申报自动化。系统智能识别各政府网站的表单结构自动填写企业信息上传所需文件。支持复杂的业务流程如多步骤验证、文件格式转换、提交状态跟踪等。实施效果申报效率提升10倍减少人工操作时间错误率降低90%避免因填写错误导致的退件支持批量申报一次处理多个申请申报状态实时跟踪及时发现问题实例4人力资源招聘流程自动化场景描述HR部门需要在多个招聘网站发布职位、筛选简历、安排面试流程繁琐且耗时。解决方案利用Skyvern自动化招聘流程。自动登录各招聘平台发布职位信息定期检查新简历初步筛选合格候选人。集成日历系统自动发送面试邀请和后续跟进邮件。实施效果招聘流程时间缩短60%简历筛选效率提升5倍确保各平台信息同步更新候选人体验提升响应更及时实例5学术研究数据收集场景描述研究机构需要从多个学术数据库收集文献资料手动检索和下载效率低下。解决方案部署Skyvern学术数据收集系统。自动访问IEEE、Springer等学术数据库根据关键词搜索相关文献下载全文并提取元数据。支持复杂的检索策略和增量更新。实施效果文献收集效率提升20倍支持大规模系统性文献回顾自动去重和分类减少人工整理7×24小时不间断收集不错过最新研究实例6客户服务工单处理场景描述客服团队需要登录多个第三方系统处理客户工单界面不统一导致操作效率低下。解决方案使用Skyvern构建统一的工单处理界面。自动登录各客服系统提取待处理工单按照预设规则进行分类和分配。支持自动回复常见问题复杂问题转人工处理。实施效果工单处理时间减少40%客服人员工作负担减轻响应一致性提升客户满意度提高支持多语言客户服务GitHub地址项目地址https://github.com/Skyvern-AI/skyvern项目信息⭐ Stars持续增长中 许可证AGPL-3.0 主要语言Python 最近更新持续维护相关资源官方文档详细的安装和使用指南技术报告性能评估和技术细节社区支持GitHub Discussions和Discord在线演示项目提供示例和演示视频快速开始访问GitHub仓库了解项目详情选择适合的安装方式pip或Docker配置LLM提供商API密钥运行示例任务体验功能根据业务需求定制工作流注意事项使用前请确保遵守目标网站的使用条款合理设置请求频率避免对目标网站造成压力重要任务建议先在测试环境验证定期更新以获取最新功能和性能优化Skyvern通过AI技术大幅降低了浏览器自动化的技术门槛让非技术人员也能轻松构建复杂的自动化工作流为企业数字化转型提供了强大的技术支撑。