Reading | 读《杀死一只知更鸟》
终于把这本书看完了!对于三四年没看过一本小说的人来说,再次捡起读书的热情真的是一件有些痛苦的事情:痛苦的其实并不是读书本身,而是要与自己的惰性进行对抗。手机时时刻刻在身边,没事干的时候总是条件反射般地点进 B 站刷视频,脑子放空成为了一种习惯,再阅读大量文字确实有些不习惯。这本书我在去年 10 月 22 日放到微信读书,磨磨蹭蹭地看开头,直到昨天才看完整本,总用时 5 小时 14 分 首先...
终于把这本书看完了!对于三四年没看过一本小说的人来说,再次捡起读书的热情真的是一件有些痛苦的事情:痛苦的其实并不是读书本身,而是要与自己的惰性进行对抗。手机时时刻刻在身边,没事干的时候总是条件反射般地点进 B 站刷视频,脑子放空成为了一种习惯,再阅读大量文字确实有些不习惯。这本书我在去年 10 月 22 日放到微信读书,磨磨蹭蹭地看开头,直到昨天才看完整本,总用时 5 小时 14 分 首先...
这一年一年的过的可真快,2023 年又要过去了。既然想要好好写博客,那就从年度总结开始吧!
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/traps.html 难度: Before you start coding, read Chapter 4 of the xv6 book, and related source files: ...
MaskFormer 三种不同分割任务 Semantic Segmentation:对一张图片的所有像素点进行分类 Instance Segmentation:目标检测和语义分割的结合 Panoptic Segmentation:语义分割和实例分割的结合 Per-pixel classification formulation 语义分割的目的是将图像划分为具有不同...
链接:论文,Github TL;DR 本文介绍了一种基于 Transformer 的端到端目标检测方法DETR。与传统的方法不同,DETR 直接预测对象的边界框和类别标签,避免了繁琐的后处理步骤。文章详细介绍了 DETR 的损失函数和模型结构,并通过实验证明了 DETR 在 COCO 数据集上与 Fastee R-CNN 相当甚至更好的性能。此外,DETR 的设计还可以扩展到...
链接:论文,Github TL;DR 本文提出了一种名为群组式引用表达分割(GRES)的新方法,以解决引用表达分割(RES)在现实世界场景中的限制。RES专注于根据文本描述在单个图像中分割对象,但无法保证描述的对象在图像中的存在。GRES将RES扩展到一组相关图像,并提出了一种名为群组引用分割器(GRSer)的基线方法,利用语言和组内视觉连接来获得更好的结果。该论文还介绍了群组引用数据...
链接:论文,Github TL;DR 文介绍了一种名为 Mask Matching Transformer 的方法,用于解决少样本语义分割问题。该方法通过将分割和匹配模块的学习解耦,采用少对少的匹配范式,提高了分割性能。具体而言,该方法包括三个模块:特征提取模块、潜在物体分割器和掩码匹配模块。特征提取模块使用 ResNet 提取图像特征,潜在物体分割器生成多个掩码提案,掩码匹配模块通过...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/pgtbl.html 难度: Before you start coding, read Chapter 3 of the xv6 book, and related files: kern...
链接:https://pdos.csail.mit.edu/6.S081/2021/labs/syscall.html 难度: Before you start coding, read Chapter 2 of the xv6 book, and Sections 4.3 and 4.4 of Chapter 4, and ...
1. CLIP 笔记 标题:Learning Transferable Visual Models From Natural Language Supervision 链接:论文,官方博客,GitHub 1.1 TL;DR 1.2 方法 直接上图1: CLIP 这个模型的结构很简单,甚至是简单粗暴,但很有用。模型由一个图像编码器和一个文本编码器组成,图像编码器可以使...