在重听李沐老师的《Resnet 论文精读》这一课的时候,ps:「之前没有好好读,:>)羞耻」。在讲到双栏论文中第一页的第二栏最上面,这个
本文介绍 Tranformer 的代码。 模型结构 Encoder 将输入序列$(x_{1},\cdots,x_{n})$ 映射成一个连续的序列$z = (z_{1},\cdots,z_
这一段时间我也一直在思考,毕业之后的发展。读了许多大佬写的博客,想着能够从中汲取一些经验和启发。发现大家都有一个共性就是善于总结和对自己的职
工作中常需要连接着服务器,比如在深度学习训练模型的过程中,需要长时间连接着服务器,在一段时间没有操作后,ssh 会自动断开。 为了解决这个问题,