Author: volica

68  0

[多模态]Everything at Once

Multi-modal Fusion Transformer for Video Retrieval Abstract 从视频数据中进行多模态学习最近受到了越来越多的关注,因为它允许在没有人工注释的情...

44  0

Ubuntu20.04

grub https://blog.csdn.net/seaship/article/details/96427401 Nvidia Driver https://blog.csdn.net/z_6_...

49  0

[略读]ObjectBox

From Centers to Boxes for Anchor-Free Object Detection 主要贡献|Keypoints 标签分配|Label Assignment 在三层特征图上预...

381  0

[精读]表格问答TAPAS

文献 TAPAS:Weakly Supervised Table Parsing via Pre-training Abatract 通过表格回答自然语言问题通常被视为语义解析任务。为了减轻完整逻辑格...

44  0

[精读]DINO

SwAV https://arxiv.org/pdf/2006.09882.pdf DINO https://arxiv.org/pdf/2104.14294.pdf Abstract 无监督图像表示...

465  0

世界毕竟不是由天才创造的2

前几天雪梨发来篇文章,追溯源头可能是《世界毕竟不是由天才创造的》,为了防止原博客也失效,我将原文复制在下方: 前几天晚饭间,老华组织在座的12个人玩一个猜数字的游戏,游戏规则是这样的: 每人给出一个从...

575  0

[略读]Twins系列

Twins: Revisiting the Design of Spatial Attention in Vision Transformers Conditional Positional Enco...