Category: ★····论文

1,391  0

[略读]mixup: BEYOND EMPIRICAL RISK MINIMIZATION

Abstract 深度神经网络功能强大,但是存在一些不良行为例如记忆性和对对抗样本的敏感性。(it:关注点偏移,趋向简单规则+对异常分布敏感)Mixup给神经网络增加了正则信息,使网络在训练样本中和训...

1,631  0

[略读]Sequence Transduction with Recurrent Neural Networks

RNNT原文下载地址 Abstract 很多模型都进行的是转换任务,例如语音识别、机器翻译、蛋白质二级结构生产、文字转语音等。在时序转换任务中,有一个关键挑战是寻找一种在收缩、拉伸、平移下有序列不变性...