Lv.2
Hint
更多个人资料
125
成长值
1
关注
5
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
人工智能、云计算
个人勋章
TA还没获得勋章~
成长雷达
90
15
0
0
20
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
人工智能、云计算
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
全部时间
全部时间
最近三天
最近一周
最近一月
全部
暂无专栏分类
RT-DETR:超越YOLO系列的实时目标检测
近年来,基于Transformer的端到端目标检测器越来越受到学术界的关注和研究。然而DETR复杂的计算量导致它很难在实际应用中落地,因此本文提出了第一个满足实时性要求的DETR模型RT-DETR[1]。
人工智能
深度学习
神经网络
Hint
2023-07-29 16:10:36
7593
0
0
2023-07-29 16:10:36
999+
0
0
CutLER:一种用于无监督目标检测和实例分割的方法
目标检测和实例分割是两个重要的计算机视觉任务,然而这方面的无监督方法比较罕见,因为难以低成本的获取伪标注或有效的自监督手段。本文CutLER[1]提出了MaskCut方法来生成图片中多个目标的粗糙的掩膜,并设计一个鲁棒的损失函数让检测器从这些掩膜中有效的进行学习。相较于以前的工作,该方法简洁且适配不同的检测模型结构,在各个评测数据集上取得了优异的检测效果。
人工智能
深度学习
神经网络
Hint
2023-07-29 16:07:23
7613
0
0
2023-07-29 16:07:23
999+
0
0
SAM适配下游任务的探究:SAM Adapter
近期大模型的涌现给AI研究带来显著的发展,META的工作Segment Anything(SAM)[1],就是其中一个为图像分割任务设计的基础大模型。然而SAM在一些特定的分割任务中表现不佳,比如阴影检测和伪装物体检测。所以如何利用预训练的大模型去适配效果不佳的下游任务成为了一个有意义的研究方向。
人工智能
机器学习
深度学习
Hint
2023-07-29 15:57:58
8136
0
0
2023-07-29 15:57:58
999+
0
0
基于卷积神经网络的MAE自监督方法
图像自监督预训练算法是近年来的重要研究方向,MAE是其中基于ViT实现的代表性方法,学习到了鲁棒的视觉特征。然而基于CNN网络架构的类MAE方式难以实现,受限于网络本身的特性。本文介绍ICLR2023的方法Spark,实现了基于CNN的MAE。
人工智能
卷积神经网络
深度学习
神经网络
Hint
2023-07-29 15:49:20
8234
0
0
2023-07-29 15:49:20
999+
0
0
场景文本理解预训练PreSTU
在视觉与语言(V&L)模型中,阅读和推理图像中的文本的能力往往是缺乏的。我们如何才能学习出强大的场景文本理解(STU)的V&L模型呢?本文提出了PreSTU,一个专门为场景文本理解而设计的简单预训练模型。PreSTU将一个简单的OCR感知预训练目标与一个具有现成OCR信号的大规模图像-文本数据集相结合。
OCR
机器学习
深度学习
Hint
2022-11-11 15:46:46
4817
0
1
2022-11-11 15:46:46
999+
0
1
[CVPR 2022] 不使用人工标注提升文字识别器性能
本文提出了一种针对文字识别的半监督方法。区别于常见的半监督方法,本文的针对文字识别这类序列识别问题做出了特定的设计。具体来说,本文首先采用了teacher-student的网络结构,然后采用字符级别的一致性约束对teacher和student网络的预测进行对齐。此外,考虑到文字识别是step-by-step,每一个字符的预测都和之前时刻的预测结果相关。
人工智能
OCR
机器学习
Hint
2022-11-07 19:49:12
7582
0
0
2022-11-07 19:49:12
999+
0
0
一种针对文字识别的多模态半监督方法
本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。
OCR
机器学习
Hint
2022-11-04 11:46:04
7570
0
0
2022-11-04 11:46:04
999+
0
0
[NeurIPS 2022]基于语义聚合的对比式自监督学习方法
近些年来,利用大规模的强标注数据,深度神经网络在物体识别、物体检测和物体分割任务中取得巨大进展。然而,强标注数据耗时又耗力。为此,自监督学习方法提出从大量的无标注数据中学习出高效的特征编码器,然后利用该特征编码器在小规模数据上进行强监督训练,以此达到和在大规模强标注数据上训练的模型相当的性能。基于对比式自监督学习方法的出发点为:从不同视角来观察图像,将来自同一图像的不同视角的图...
机器学习
神经网络
Hint
2022-11-04 11:40:42
7715
0
0
2022-11-04 11:40:42
999+
0
0
[NeurIPS 2022] 消除视觉Transformer与卷积神经网络在小数据集上的差距
本文简要介绍NeurIPS 2022录用的论文“Bridging the Gap Between Vision Transformers and Convolutional Neural Networks on Small Datasets”的主要工作。该论文旨在通过增强视觉Transformer中的归纳偏置来提升其在小数据集上从随机初始化开始训练的识别性能。
神经网络
Hint
2022-11-03 17:28:33
9216
0
2
2022-11-03 17:28:33
999+
0
2
https://www.baidu.com/s?ie=utf-8&f=3&rsv_bp=0&rsv_idx=1&tn=baidu&wd=sed%20%E6%9B%BF%E6%8D%A2%E5%AD%97%E7%AC%A6%E4%B8%B2&rsv_pq=c7db61a600035dc5&rsv_t=5e19yEsbV9N5fIvdlGRU
+ 关注