手机网站带后台源代码网站建设的基本内容
2026/4/18 4:27:48 网站建设 项目流程
手机网站带后台源代码,网站建设的基本内容,wordpress服务器选择,智能魔方网站背景 利用qwen-vl加提示词功能#xff0c;精准识别营业厅工作人员行为#xff0c;准确区分顾客与工作人员#xff0c;并且能够识别工作人员行为、精准定位工作人员#xff0c;帮助实现相关工作场所的监控管理。 如果只用qwen-vl而不进行提示词工程、流程筛分等工作的话精准识别营业厅工作人员行为准确区分顾客与工作人员并且能够识别工作人员行为、精准定位工作人员帮助实现相关工作场所的监控管理。如果只用qwen-vl而不进行提示词工程、流程筛分等工作的话模型非常有可能把顾客识别成工作人员我用两个小时才调试好。目前能实现工作人员的精准识别对于玩手机等行为也能识别出来但是具体行为分类还有待加强柜台外的工作人员暂时无法识别。使用网络图片效果如下真正的业务图片会更清楚一些中间绿色的女工作人员其实应该是使用手机这张图片使用qwen3-vl-flash能将左侧女工作人员判定为”正常工作”使用手机整体流程步骤1逐个分析图中的人员结合衣着是否是工作服、位置是否位于柜台内来进行识别重点是让模型理解什么是“柜台内”我用名词解释实现了让模型在长上下文推理中始终把握“柜台内是工作人员、柜台外是顾客”我用复述技巧实现了。完成了这两点就可以精准识别工作人员了。在这一步骤中我的“复述”技巧vl视觉模型不太能遵循我本来是想让vl模型每识别一个人就复述一遍但是这会破坏vl模型的理解能力。类似的技巧在语言模型中就能完美适用充分说明了语言模型与视觉模型的差异。下面是我的提示词假设工作人员都在柜台内逐个分析图中人员找出工作人员和顾客。**逐个识别图中人员每次分析人员身份前 请复述【请注意工作人员位于柜台内图片下方穿着工作服顾客位于柜台外其他位置不穿工作服】**每位人员的详细描述*位置柜台内或柜台外见名词解释*衣着是否穿工作服*当前行为使用电脑、使用手机等 名词解释-柜台内位于屏幕下方专属于工作人员可以看到电脑、办公桌等办公设备类似于办公室-柜台外位于屏幕中央顾客等待、接受服务的区域类似于办事大厅步骤2可选生成环境描述这一步可选可不选。提示词模型生成的请详细描述这张营业厅场景图片的环境和氛围需要包含以下内容 【环境描述】1.营业厅的整体环境2.营业厅的设施设备3.人员活动情况步骤3在这一部中需要结合第一步的结果生成画框框定工作人员及其行为。参考内容{reference_section}来自步骤1。结合【参考信息】识别图片中的所有**工作人员**并输出坐标{reference_section}**【识别字段】**1.bbox_2dbbox_2d格式坐标值范围0-9992.label-使用电脑工作人员正在操作电脑-使用手机工作人员正在使用手机-正常工作工作人员在进行其他工作活动如接待顾客、整理文件、站立服务等**【输出格式】**请以JSON格式输出[{{bbox_2d:[x1,y1,x2,y2],label:工作人员-使用电脑}}]完整代码见资源附件或github

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询