torch yolov3梯度发散
【摘要】 torch yolov3梯度发散
原因:
每次计算之前zero_grad,梯度清0,如果没有这句
梯度会累加,产生一个很大的值,后面会梯度发散。
imgs = Variable(imgs.type(Tensor))
targets = Variable(targets.type(Tensor), requires_grad=False)
optimizer.zero_gra...
torch yolov3梯度发散
原因:
每次计算之前zero_grad,梯度清0,如果没有这句
梯度会累加,产生一个很大的值,后面会梯度发散。
imgs = Variable(imgs.type(Tensor))
targets = Variable(targets.type(Tensor), requires_grad=False) optimizer.zero_grad() loss = model(imgs, targets) loss.backward() optimizer.step()
文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/jacke121/article/details/80783617
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)