商汤科技2019顶会论文
商汤在2019年视觉顶会的表现
第一部分是总体介绍,第二部分是具体论文分享
•62篇论文入选CVPR2019:
•高层视觉核心算法——物体检测与分割
•底层视觉核心算法——图片复原与补全
•面向自动驾驶场景的 3D 视觉
•面向 AR/VR 场景的人体姿态迁移
•无监督与自监督深度学习
比赛:
AI CITY Challenge(CVPR 2019 Workshop)异常检测赛道中获得冠军(城市智慧交通,检测交通异常,如道路事故,车辆故障)
CVPR 2019 Workshop NTIRE 2019视频恢复比赛中获得冠军(视频去模糊和视频超分辨率)
•57篇论文入选ICCV2019
其中 Oral(4.62%) 论文 11 篇
•面向目标检测的深度网络基础算子
•基于插值卷积的点云处理主干网络
•面向 AR/VR 场景的人体感知与生成
•面向全场景理解的多模态分析
13项冠军:
Open Image: 检测和分割
自监督学习比赛
多标签视频分类
实施目标跟踪挑战赛
大模型视频人脸识别
•3 篇论文入选NIPS2019
CVPR
2019 oral
Adapting Object Detectors via Selective Cross-Domain Alignment
目标检测的迁移学习
PointRCNN:3D Object Proposal Generation and Detection from Point Cloud
Motivation:3D 物体检测是自动驾驶重要研究方向,已有方法通常将点云数据投影到鸟瞰图上,然后基于 2D 检测方法对 3D检测框 进行回归。
Contribution:提出了基于原始点云数据的二阶段3D物体检测框架,PointRCNN。自底向上直接从原始点云数据中同步进行前景点分割和 3D 初始框生成。
阶段一,从每个前景点生成对应的 3D 初始框,避免了在 3D 空间中放置大量候选框。
阶段二,3D 初始框平移和旋转到统一坐标系下,通过点云池化等操作后得到每个初始框的全局语义特征和局部几何特征,然后融合进行 3D 框的修正和置信度打分,获得最终 3D 检测框。
Result:KITTI 3D 检测,在只使用点云数据的情况下召回率和检测准确率均超越了已有方法。
- 点赞
- 收藏
- 关注作者
评论(0)