介绍不同服务器间快速传输文件的方法,无需联网、下载到本地或使用软件中转。
Read More
介绍一些有助于科研的网站,主要用于自用留存记录。
Read More
介绍从github上拉取项目代码的常用方法,有无代理皆可使用。
Read More
介绍如何在非团队协作的情况下,单人更新Github仓库中的文件。
Read More
介绍PPO算法中的优势函数At如何得到。
Read More
介绍基础概念:信息、熵、交叉熵。
Read More
"Scaling Laws For Neural Language Models" 是一个研究领域,它探讨了神经语言模型的性能如何随着模型大小、数据集规模和计算资源的增加而变化。
Read More
单词的共现,简单来说,就是指两个或多个单词在文本中一起出现的情况。当我们说两个单词“共现”时,我们指的是它们在句子或段落中彼此相邻或者靠近出现。
Read More
“残差连接”(Residual Connection)是深度学习中一个非常经典且重要的概念。
Read More
Agentic 是指具有自主性和主动性的系统或实体,能够自主地感知环境、做出决策并采取行动以实现特定目标。
Read More
Q-learning 是一种无模型的强化学习算法,通过学习状态-动作值函数(Q函数)来实现最优策略。
Read More
Transformer Block 是 Transformer 模型中的核心组件,包含多头注意力机制和前馈神经网络。
Read More
RoPE 是一种用于 Transformer 模型中的位置编码方法,通过旋转矩阵来处理序列中的位置信息。
Read More
通俗理解 Embedding 层。
Read More
2026-2-28
Cross-Entropy Loss
交叉熵损失函数。
Read More
BN 是 Batch Normalization(批归一化) 的缩写。它是深度学习中一种非常基础和常用的技术,旨在解决训练过程中神经网络内部协变量偏移(Internal Covariate Shift)的问题,从而加速和稳定训练。
Read More
**选择性批归一化(SBN)**:它在计算归一化统计量时,根据输入图像的来源(干净或某种特定损坏)进行了**选择**。
Read More