volica – 我家Ai智障

05

2 月

2021

2,304 0

[翻译]See Better Before Looking Closer

See Better Before Looking Closer: Weakly Supervised Data Augmentation Network for Fine-Grained Visua...

25

1 月

2021

5,634 0

[翻译]AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

Abstract 尽管Transformer结构在自然语言处理领域已经成为主流，但在计算机视觉领域仍然受到限制。在视觉领域，注意力结构要么和卷积网络一起应用，要么在保证总结构不变的情况下用于替换卷网络...

30

12 月

2020

2,302 0

[略读]mixup: BEYOND EMPIRICAL RISK MINIMIZATION

Abstract 深度神经网络功能强大，但是存在一些不良行为例如记忆性和对对抗样本的敏感性。（it：关注点偏移，趋向简单规则+对异常分布敏感）Mixup给神经网络增加了正则信息，使网络在训练样本中和训...

26

11 月

2020

2,142 0

[略读]LITE TRANSFORMER WITH LONG-SHORT RANGE ATTENTION

INTRODUCTION 本文关注移动设备上的推理加速，即Mult-Adds限制在500M以下。首先，本能想法是减少embedding的尺寸，但会弱化模型捕捉长短距离关系的能力，导致性能下降；然后...

10

10 月

2020

2,900 0

[略读]Sequence Transduction with Recurrent Neural Networks

RNNT原文下载地址 Abstract 很多模型都进行的是转换任务，例如语音识别、机器翻译、蛋白质二级结构生产、文字转语音等。在时序转换任务中，有一个关键挑战是寻找一种在收缩、拉伸、平移下有序列不变性...

09

10 月

2020

2,323 0

[工具]希腊字母读法

Α α：阿尔法 AlphaΒ β：贝塔 BetaΓdu γ：伽玛 GammaΔ δ：德尔zhi塔 DelteΕ ε：艾普西龙 EpsilonΖdao ζ ：捷塔 ZetaΕ η：依塔 EtaΘ θ：西...

09

10 月

2020

3,204 0

[翻译]Joint CTC/attention decoding for end-to-end speech recognition

Abatract 当前系统严重依赖围绕传统技术发展起来的复杂遗留架构的脚手架。存在的问题有：目前的HMM+GMM+DNN方法，训练声学模型(语音[/latex]gt;音素)、语言模型(音素[/lat...

02

9 月

2020

2,397 0

[翻译]Online Hybrid CTC/Attention Architecture for End-to-end Speech Recognition

# 摘要混合CTC/注意端到端自动语音识别(ASR)将CTC ASR系统和注意ASR系统组合成一个单一神经网络。尽管混合CTC/注意ASR系统在训练和解码方面同时兼顾了CTC和注意架构的优点，但其注...

31

8 月

2020

2,348 0

[Trick]标签平滑

引用自 https://blog.csdn.net/sinat_36618660/article/details/100166957 why 在深度学习样本训练的过程中，我们采用one-hot标签去进...

17

2 月

2020

3,169 0

[小结]Bottom-Up Higher-Resolution Networks for Multi-Person Pose Estimation

项目地址 https://github.com/HRNet/Higher-HRNet-Human-Pose-Estimation 总结用高分辨率网络完成Bottom-Up姿态识别。聚合关节点使用Ho...

Author: volica