Author: volica

1,376  0

[略读]mixup: BEYOND EMPIRICAL RISK MINIMIZATION

Abstract 深度神经网络功能强大,但是存在一些不良行为例如记忆性和对对抗样本的敏感性。(it:关注点偏移,趋向简单规则+对异常分布敏感)Mixup给神经网络增加了正则信息,使网络在训练样本中和训...

1,609  0

[略读]Sequence Transduction with Recurrent Neural Networks

RNNT原文下载地址 Abstract 很多模型都进行的是转换任务,例如语音识别、机器翻译、蛋白质二级结构生产、文字转语音等。在时序转换任务中,有一个关键挑战是寻找一种在收缩、拉伸、平移下有序列不变性...

1,245  0

[工具]希腊字母读法

Α α:阿尔法 AlphaΒ β:贝塔 BetaΓdu γ:伽玛 GammaΔ δ:德尔zhi塔 DelteΕ ε:艾普西龙 EpsilonΖdao ζ :捷塔 ZetaΕ η:依塔 EtaΘ θ:西...

1,295  0

[Trick]标签平滑

引用自 https://blog.csdn.net/sinat_36618660/article/details/100166957 why 在深度学习样本训练的过程中,我们采用one-hot标签去进...