MIT 6.S081 | 0x04 Traps
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/traps.html 难度: Before you start coding, read Chapter 4 of the xv6 book, and related source files: ...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/traps.html 难度: Before you start coding, read Chapter 4 of the xv6 book, and related source files: ...
MaskFormer 三种不同分割任务 Semantic Segmentation:对一张图片的所有像素点进行分类 Instance Segmentation:目标检测和语义分割的结合 Panoptic Segmentation:语义分割和实例分割的结合 Per-pixel classification formulation 语义分割的目的是将图像划分为具有不同...
链接:论文,Github TL;DR 本文介绍了一种基于 Transformer 的端到端目标检测方法DETR。与传统的方法不同,DETR 直接预测对象的边界框和类别标签,避免了繁琐的后处理步骤。文章详细介绍了 DETR 的损失函数和模型结构,并通过实验证明了 DETR 在 COCO 数据集上与 Fastee R-CNN 相当甚至更好的性能。此外,DETR 的设计还可以扩展到...
链接:论文,Github TL;DR 本文提出了一种名为群组式引用表达分割(GRES)的新方法,以解决引用表达分割(RES)在现实世界场景中的限制。RES专注于根据文本描述在单个图像中分割对象,但无法保证描述的对象在图像中的存在。GRES将RES扩展到一组相关图像,并提出了一种名为群组引用分割器(GRSer)的基线方法,利用语言和组内视觉连接来获得更好的结果。该论文还介绍了群组引用数据...
链接:论文,Github TL;DR 文介绍了一种名为 Mask Matching Transformer 的方法,用于解决少样本语义分割问题。该方法通过将分割和匹配模块的学习解耦,采用少对少的匹配范式,提高了分割性能。具体而言,该方法包括三个模块:特征提取模块、潜在物体分割器和掩码匹配模块。特征提取模块使用 ResNet 提取图像特征,潜在物体分割器生成多个掩码提案,掩码匹配模块通过...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/pgtbl.html 难度: Before you start coding, read Chapter 3 of the xv6 book, and related files: kern...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/syscall.html 难度: Before you start coding, read Chapter 2 of the xv6 book, and Sections 4.3 and 4.4 of Chapter 4, and ...
1. CLIP 笔记 标题:Learning Transferable Visual Models From Natural Language Supervision 链接:论文,官方博客,GitHub 1.1 TL;DR 1.2 方法 直接上图1: CLIP 这个模型的结构很简单,甚至是简单粗暴,但很有用。模型由一个图像编码器和一个文本编码器组成,图像编码器可以使...
Title: Multimodal Learning with Transformers: A Survey (基于Transformer的多模态学习:综述) Authors: Peng Xu, Xiatian Zhu, and David A. Clifton Affiliation: Peng Xu is with Tsinghua University (清华大学). Xiat...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/util.html 难度: 这次实验通过几个小的任务让我们熟悉实验的流程以及 xv6 系统的整体概况。从名字可以看出,这次实验只是...