经典/最新计算机视觉论文及代码推荐

举报
小小谢先生 发表于 2022/06/11 22:41:33 2022/06/11
【摘要】 今日推荐几篇最新计算机视觉方向的论文,全部都是基于最近很火的transformer框架来进行目标检测或跟踪,把这几篇论文和代码研究透,基本就对基于transformer的框架有个大概了解,具体内容详见论文原文和代码,。 transformer端到端检测 论文题目:End-to-End Object Detection with...

今日推荐几篇最新计算机视觉方向的论文,全部都是基于最近很火的transformer框架来进行目标检测或跟踪,把这几篇论文和代码研究透,基本就对基于transformer的框架有个大概了解,具体内容详见论文原文和代码,。

transformer端到端检测

  • 论文题目:End-to-End Object Detection with Transformers

  • 论文链接:https://arxiv.org/pdf/2005.12872v3.pdf

  • 代码链接:https://github.com/facebookresearch/detr

作者提出了一种目标检测的新方法,将物体检测视为一个直接的集合预测问题,是第一个将 transformer 成功整合为检测 pipeline 中心构建块的目标检测框架。基于Transformers的端到端目标检测,没有NMS后处理步骤、真正的没有anchor,且对标超越Faster RCNN。


这篇论文是transformer框架目标检测的开山之作,真正使transformer从自然语言处理杀入到目标检测领域。

基于transformer的3D目标检测

  • 论文题目:An End-to-End Transformer Model for 3D Object Detection

  • 论文链接:https://arxiv.org/pdf/2109.08141v1.pdf

  • 代码链接:https://github.com/facebookresearch/3detr

作者提出了3DETR,一个基于Transformer的端到端三维点云物体检测模型。与现有的检测方法相比,3DETR需要对普通的Transformer块进行最小的修改,这些方法采用了一些特定的3D感应偏置。具体来说,作者发现,具有非参数查询和傅里叶位置嵌入的标准转化器与采用具有手工调整的超参数的三维特定运算器库的专门架构相比,具有优势。

用HOI变换器进行端到端的人与物互动检测

  • 论文题目:End-to-End Human Object Interaction Detection with HOI Transformer

  • 论文链接:https://arxiv.org/pdf/2103.04503v1.pdf

  • 代码链接:https://github.com/bbepoch/HoiTransformer

作者提出了HOI Transformer,以端到端的方式解决人与物体交互(HOI)检测问题。目前的方法要么将HOI任务解耦为物体检测和交互分类的独立阶段,要么引入代用的交互问题。相比之下,作者提出的HOI Transformer,通过消除对许多手工设计的组件的需要,简化了HOI管道。HOI Transformer从全局图像背景中推理出物体和人类的关系,并直接并行地预测HOI实例。

后续

下一期最新/经典视觉论文敬请期待!

文章来源: blog.csdn.net,作者:小小谢先生,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/xiewenrui1996/article/details/125233131

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。