莯风

Reading | 读《杀死一只知更鸟》

终于把这本书看完了!对于三四年没看过一本小说的人来说,再次捡起读书的热情真的是一件有些痛苦的事情:痛苦的其实并不是读书本身,而是要与自己的惰性进行对抗。手机时时刻刻在身边,没事干的时候总是条件反射般地点进 B 站刷视频,脑子放空成为了一种习惯,再阅读大量文字确实有些不习惯。这本书我在去年 10 月 22 日放到微信读书,磨磨蹭蹭地看开头,直到昨天才看完整本,总用时 5 小时 14 分 首先...

Paper | End-to-End Object Detection with Transformers

链接:论文,Github TL;DR 本文介绍了一种基于 Transformer 的端到端目标检测方法DETR。与传统的方法不同,DETR 直接预测对象的边界框和类别标签,避免了繁琐的后处理步骤。文章详细介绍了 DETR 的损失函数和模型结构,并通过实验证明了 DETR 在 COCO 数据集上与 Fastee R-CNN 相当甚至更好的性能。此外,DETR 的设计还可以扩展到...

Paper | Advancing Referring Expression Segmentation Beyond Single Image

链接:论文,Github TL;DR 本文提出了一种名为群组式引用表达分割(GRES)的新方法,以解决引用表达分割(RES)在现实世界场景中的限制。RES专注于根据文本描述在单个图像中分割对象,但无法保证描述的对象在图像中的存在。GRES将RES扩展到一组相关图像,并提出了一种名为群组引用分割器(GRSer)的基线方法,利用语言和组内视觉连接来获得更好的结果。该论文还介绍了群组引用数据...

Paper | Mask Matching Transformer for Few-Shot Segmentation

链接:论文,Github TL;DR 文介绍了一种名为 Mask Matching Transformer 的方法,用于解决少样本语义分割问题。该方法通过将分割和匹配模块的学习解耦,采用少对少的匹配范式,提高了分割性能。具体而言,该方法包括三个模块:特征提取模块、潜在物体分割器和掩码匹配模块。特征提取模块使用 ResNet 提取图像特征,潜在物体分割器生成多个掩码提案,掩码匹配模块通过...