2026/4/18 18:11:44
网站建设
项目流程
人社局网站建设方案,企业网站的价值,给企业做网站公司,网站备案的服务器TextIn大模型加速器火山引擎: 文档结构化数据处理工具扣子智能体工作流创建指南
背景
随着“数字员工”的全面上岗#xff0c;合合信息与火山引擎联合推出的“大模型加速器”升级版TextIn xParse插件正式发布。这一工具为企业与开发者提供了强大的AI工程化能力#xff0c;帮…TextIn大模型加速器火山引擎: 文档结构化数据处理工具扣子智能体工作流创建指南背景随着“数字员工”的全面上岗合合信息与火山引擎联合推出的“大模型加速器”升级版TextIn xParse插件正式发布。这一工具为企业与开发者提供了强大的AI工程化能力帮助加速文档结构化处理及数据应用。本文将介绍如何通过TextIn xParse和火山引擎平台创建高效的智能体工作流提升结构化文档解析与处理能力先看效果图如下TextIn产品注册即送TextIn平台3000页体验coze智能体平台coze平台官网文章目录TextIn大模型加速器火山引擎: 文档结构化数据处理工具扣子智能体工作流创建指南背景一、什么是TextIn xParse二、创建智能体应用步骤一进入coze智能体平台步骤二填写智能体信息步骤三添加TextIn xParse插件三、创建Agent工作流节点四、添加TextIn xParse插件五、模块参数配置模块“开始”节点插件模块“ParseX”配置填写TextIn参数信息六、配置大模型模块设置“ParseX”模块输出选择大模型设置大模型输入参数设置输出变量启动工作流输出格式微调七、实测图表解析能力原图还原后的表格试验数据表八、发票数据解析能力原发票九、TextIn API 接入演示十、哪些场景适合使用TextIn大模型加速器应用场景客户案例总结一、什么是TextIn xParseTextIn xParse是由合合信息推出的文档结构化处理工具组合包含「通用文档解析服务」和「ETL数据处理工具箱」旨在帮助用户将非结构化文档如合同、财报、简历等转化为结构化数据。它兼容关系型数据库和向量数据库适配RAG开发、LLM应用和业务数据分析等多种场景支持数百种专业文档类型与10文件格式。该工具的解析准确性和效率处于行业领先地位能够极大提高文档处理效率并为开发者和企业带来极大的便利。二、创建智能体应用步骤一进入coze智能体平台首先打开coze智能体平台官网https://www.coze.cn/home进入后选择“工作空间” - “项目开发” - “创建” - “创建智能体” - “创建”。步骤二填写智能体信息在弹出的界面中输入智能体的名称和简介点击“下一步”确认。步骤三添加TextIn xParse插件在智能体中你可以直接通过插件方式使用TextIn xParse。在插件市场中搜索“通用文档解析专业版”并添加该插件。智能体部分的配置可根据个人需求进行深入探索本文将重点讲解如何在工作流中应用TextIn xParse插件的强大能力。三、创建Agent工作流节点首先进入工作流页面点击“创建工作流”。在此页面中输入工作流名称和相关信息点击“确定”完成创建。完成后工作流创建完成界面如下所示我们已经拥有两个默认的工作流节点。四、添加TextIn xParse插件进入工作流配置页面后点击“开始”节点页面右侧的加号进入插件市场。搜索“通用文档解析专业版”并点击添加 就可以将插件加入到工作流中接下来我们将对模块参数进行初步配置以确保流程的正确启动。五、模块参数配置模块“开始”节点在工作流中的“开始”模块设置类型为input File.Default。插件模块“ParseX”配置设置类型File 开始.input填写TextIn参数信息app_idTextIn.com账号信息需要登录后前往“工作台-账号设置-开发者信息”查看x-ti-app-id。填写后确保各个字段配置准确。secret_code同样需要通过TextIn.com账号信息查看并填充x-ti-secret-code。六、配置大模型模块设置“ParseX”模块输出点击“ParseX”模块右侧的加号选择并设置输出指向为“大模型”。选择大模型选择合适的大模型如豆包1.6、DeepSeek或kimi等进行配置。设置大模型输入参数根据需要设置大模型的输入参数如Markdown等。设置输出变量设置大模型的输出变量确保工作流的最后输出能够正确接收到返回的数据。启动工作流在配置完毕后点击“试运行”并上传PDF文件即可启动工作流并开始处理。一旦数据状态正常即可点击右上角的“发布”按钮工作流便可直接在智能体中使用。输出格式微调在大模型模块中还可以调整提示词{{input}}来控制工作流输出不同的数据格式。七、实测图表解析能力在这一部分我们将通过TextIn xParse进行图表数据的结构化处理并通过大模型还原为可识别的表格数据。原图随后使用大模型对图表数据进行还原生成的表格如下经过数据比对能够确认其识别精度达到100%数据准确无误还原后的表格接下来我们使用另一张试验数据表进行测试进一步验证其解析能力。试验数据表大模型还原后的数据表如下经过比对数据还原的精准度得到了确认通过以上两个案例我们可以看到无论是图表数据还是试验数据TextIn xParse与大模型的结合都能够精准地进行结构化并还原数据。接下来我们将尝试解析一张发票数据看看它的解析效果如何八、发票数据解析能力为进一步展示TextIn xParse的强大解析能力我们从网上找到了一张老旧发票使用它来测试TextIn xParse在发票数据解析中的表现。原发票经过TextIn xParse处理后系统返回的识别结果如下从这一实测案例中可以看出TextIn xParse对于发票等复杂文档的结构化解析表现非常优秀能够准确地提取并解析关键信息。九、TextIn API 接入演示除了可以通过智能体和工作流使用TextIn大模型加速器外我们还可以通过在线体验快速上手或者在自己的编程框架项目中直接调用TextIn API。TextIn API支持多种编程语言的接入具有很高的灵活性方便我们在不同的开发环境中使用。以下是一个用Go语言调用TextIn API的示例展示如何快速将图片中的内容提取为结构化数据。以下是完整的Go语言代码示例packagemainimport(bytesencoding/jsonfmtionet/httpnet/urlos)const(// baseURL 是TextIn API的基础URL用于发送请求baseURLhttps://api.textin.com/ai/service/v1/pdf_to_markdown)// OCRClient 定义OCR客户端结构体用于配置并发送请求typeOCRClientstruct{appIDstring// 应用ID用于标识应用secretCodestring// 秘钥用于验证应用身份baseURLstring// API的基础URL}// NewOCRClient 创建一个新的OCRClient实例并返回该实例的指针funcNewOCRClient(appID,secretCodestring)*OCRClient{// 返回一个OCRClient实例包含appID、secretCode和baseURLreturnOCRClient{appID:appID,secretCode:secretCode,baseURL:baseURL,}}// Recognize 执行OCR识别请求处理传入的PDF文件内容并返回解析后的响应func(c*OCRClient)Recognize(fileContent[]byte,optionsmap[string]any)([]byte,error){// 解析基础URLbaseURL,err:url.Parse(c.baseURL)iferr!nil{// 如果URL解析失败返回错误信息returnnil,fmt.Errorf(invalid base URL: %v,err)}// 将options中的参数添加到URL查询字符串中q:baseURL.Query()forkey,value:rangeoptions{// 遍历options将键值对格式化为字符串并添加到查询参数中q.Set(key,fmt.Sprintf(%v,value))}baseURL.RawQueryq.Encode()// 将查询参数添加到URL中// 创建HTTP POST请求发送PDF文件内容req,err:http.NewRequest(POST,baseURL.String(),bytes.NewReader(fileContent))iferr!nil{// 如果请求创建失败返回错误信息returnnil,fmt.Errorf(failed to create request: %v,err)}// 设置请求头包含appID和secretCode用于身份验证req.Header.Set(x-ti-app-id,c.appID)req.Header.Set(x-ti-secret-code,c.secretCode)// 设置请求体的Content-Type为文件流req.Header.Set(Content-Type,application/octet-stream)// 创建HTTP客户端并发送请求client:http.Client{}resp,err:client.Do(req)iferr!nil{// 如果请求发送失败返回错误信息returnnil,fmt.Errorf(failed to send request: %v,err)}deferresp.Body.Close()// 确保响应体在函数结束时关闭// 读取响应体body,err:io.ReadAll(resp.Body)iferr!nil{// 如果读取响应体失败返回错误信息returnnil,fmt.Errorf(failed to read response: %v,err)}// 检查响应的状态码确保请求成功ifresp.StatusCode!http.StatusOK{// 如果状态码不是200 OK返回错误信息returnnil,fmt.Errorf(request failed with status code %d: %s,resp.StatusCode,string(body))}// 返回解析后的响应体returnbody,nil}funcmain(){// 示例配置appID和secretCode创建OCRClient实例client:NewOCRClient(bff82d62**********c5bce256e,9ba*******************ebd)// 读取PDF文件方式一从本地读取fileContent,err:os.ReadFile(img.png)iferr!nil{// 如果文件读取失败抛出错误panic(err)}// 方式二使用URL方式需要将headers中的Content-Type改为text/plain// fileContent : []byte(https://example.com/path/to/your.pdf)// 设置请求的选项options:map[string]any{apply_document_tree:1,// 是否应用文档树apply_image_analysis:0,// 是否进行图像分析apply_merge:1,// 是否合并表格catalog_details:1,// 是否提取目录dpi:216,// DPI设置formula_level:0,// 公式提取级别get_excel:0,// 是否提取Excel表格get_image:both,// 提取图片格式markdown_details:1,// 是否提取详细的Markdownpage_count:1000,// 提取的页面数量page_details:0,// 页面详细信息page_start:1,// 开始页面paratext_mode:none,// 文字模式parse_mode:scan,// 扫描模式raw_ocr:0,// 是否启用原始OCRtable_flavor:html,// 表格的格式}// 调用Recognize方法进行OCR识别response,err:client.Recognize(fileContent,options)iferr!nil{// 如果识别失败抛出错误panic(err)}// 将完整的JSON响应保存到result.json文件iferr:os.WriteFile(result.json,response,0644);err!nil{// 如果保存文件失败抛出错误panic(err)}// 解析JSON响应以提取markdown内容varjsonResponsemap[string]interface{}iferr:json.Unmarshal(response,jsonResponse);err!nil{// 如果解析JSON失败抛出错误panic(err)}// 提取并保存markdown内容到result.md文件ifresult,ok:jsonResponse[result].(map[string]interface{});ok{ifmarkdown,ok:result[markdown].(string);ok{iferr:os.WriteFile(result.md,[]byte(markdown),0644);err!nil{// 如果保存markdown失败抛出错误panic(err)}}}// 打印JSON响应内容fmt.Println(string(response))}此外TextIn也提供了一些开源项目供开发者参考使用。下面是一个开源项目的示例通过以上实测案例我们可以看出TextIn大模型加速器与火山引擎平台的结合在多种文档数据的结构化处理与解析中表现出色为用户提供了一个灵活且强大的解决方案。十、哪些场景适合使用TextIn大模型加速器应用场景从实际应用角度来看TextIn大模型加速器主要服务于两大核心用户群体第一类专业场景用户主要面向财务、法务、采购、人力、仓储等业务部门这些岗位日常需要处理大量纸质文档、扫描件、PDF文件和图片资料。核心痛点是被各种格式的文档折磨需要进行机械重复的信息录入和审核工作。典型应用场景包括合同审核、发票处理、送货单录入、运单管理等特点是文档价值高、格式多样需要快速结构化录入来提升效率。对这类用户TextIn的价值定位是效率引擎通过AI替代重复性工作让人员专注于高价值决策。第二类数字化转型团队主要面向企业AI中台、RAG/Agent项目组等技术团队这些团队在传统做表单式数字化遇到瓶颈后需要向智能化升级。他们处理的文档特征是多语言、知识密集型需要深度语义理解能力。使用场景涵盖流程自动化到智能决策升级的整个链条。对这类用户TextIn的价值定位是AI基建通过RAGAgent技术组合让数字化从表单时代迈向智能时代。客户案例从实际落地情况来看TextIn大模型加速器已经在多个主流行业的头部厂商中得到了广泛应用和验证。在金融领域多家银行和保险公司采用TextIn处理贷款合同、保单等核心文档在制造业头部企业将其应用于供应链单据的自动化处理在电商和物流行业平台型企业利用TextIn实现了订单、运单等文档的智能解析在政务和医疗领域相关机构也通过TextIn提升了文档处理效率和准确性。这些成功案例充分证明无论是追求效率提升的业务部门还是致力于智能化转型的技术团队TextIn大模型加速器都能提供强有力的技术支撑帮助用户在各自的数字化道路上取得实质性进展。总结本文详细介绍了如何通过TextIn xParse插件和火山引擎平台构建高效的文档结构化处理工作流。我们展示了如何创建智能体应用、配置工作流节点并通过大模型加速器实现精确的图表、表格和发票数据的解析与还原。无论是通过工作流、API接口还是智能体应用TextIn xParse都展现了其强大的数据处理能力和高效的文档解析能力。从实测结果来看TextIn xParse与火山引擎平台结合为用户提供了高效、精准的文档结构化处理方案无论是在企业文档处理还是开发者应用场景中都能大大提升工作效率。如果您也希望体验这一强大的工具欢迎前往TextIn官网https://www.textin.com/register/code/KKBKQ6试用即送3000页免费体验轻松开启您的文档处理之旅。