2026/6/20 9:41:05
网站建设
项目流程
砀山做网站的公司,wordpress被改密码忘记,wordpress商品比较,域名历史记录查询网站cnn模型大小我给他控制在训练耗时30s左右#xff08;4060ti#xff09;
动作空间6个#xff1a;4个移动2个转头#xff0c;因为一开始都要跑一遍#xff0c;动作太多需要跑更多步才能吃到正反馈
我现在设置是60步一episode#xff0c;5 episode训练一次
转头70度左右4060ti动作空间6个4个移动2个转头因为一开始都要跑一遍动作太多需要跑更多步才能吃到正反馈我现在设置是60步一episode5 episode训练一次转头70度左右前后移动控制在4s时间模型可以调给了模型位移程度的控制时间设置这么长也是为了能像无头苍蝇一样先把环境用脚完全跑一遍第3个episode就已经跑出来正反馈了距离门很近这个模型我没想到的是它训练出来是用屁股走路的后退当前进走到门旁边奖励是门的面积/10000门越大奖励越高面积大于30w就给大奖励早上用小碎步是能收敛的这种奖励越训练得分越多早上哪个架构大一点训练2分钟yolo我还得重新训练一下近距离的情况遇到了贴着门太大yolo没识别出来的情况可能就是因为这样模型收敛不了