Showing 120 of 120on this page. Filters & sort apply to loaded results; URL updates for sharing.120 of 120 on this page
拆解 LLM 中的 SwiGLU - 有何m不可 - 博客园
SwiGLU Activation Function
Exploring SwiGLU : The Activation Function Powering Modern LLMs | by ...
为什么大型语言模型都在使用 SwiGLU 作为激活函数?_腾讯新闻
SwiGLU with SiLU:大模型时代的激活函数革命与架构设计精要_silu 论文-CSDN博客
为什么大型语言模型都在使用 SwiGLU 作为激活函数?-腾讯云开发者社区-腾讯云
为什么大型语言模型都在使用 SwiGLU 作为激活函数?-阿里云开发者社区
SwiGLU with GELU:重新定义前馈神经网络的激活函数设计艺术_glu、swiglu、gated ffn-CSDN博客
Beyond ReLU: Discovering the Power of SwiGLU | by heping_LU | Medium
SwiGLU activation function · Issue #20403 · huggingface/transformers ...
为什么大型语言模型都在使用 SwiGLU 作为激活函数? - 知乎
python - How to implement SwiGLU activation? Why does SwiGLU takes in ...
SwiGLU implementation in dense FFN layers in Llama 4 Scout
为什么大型语言模型都在使用 SwiGLU 作为激活函数? - 百度智能云千帆社区
人工智能 - 为什么大型语言模型都在使用 SwiGLU 作为激活函数? - deephub - SegmentFault 思否
【大模型架构笔记】大模型常用激活函数SwiGLU - 知乎
详解SwiGLU激活函数 - 知乎
What is SwiGLU? • Carlos Roldán
大模型系列:SwiGLU激活函数与GLU门控线性单元原理解析-CSDN博客
大模型基础|激活函数|从ReLU 到SwiGLU - 知乎
All the Activation Functions
【NLP高频面题 - LLM架构篇】使用SwiGLU相对于ReLU有什么好处?_动态门控机制-CSDN博客
详解如何从零构建Llama 3(含代码)!_llama3代码-CSDN博客
llama源码学习·model.py[2]SwiGLU激活函数-CSDN博客
Decoder-Only Transformers: The Workhorse of Generative LLMs
Understanding LLM through the LLaMA Models - Jie Yu’s Home Page
大模型学习笔记------Llama 3模型架构之RMS Norm与激活函数SwiGLU - 技术栈
Discovering SwiGLU: The Activation Function Powering Modern LLMs
神经网络激活函数:从ReLU到前沿SwiGLU - 技术栈
介绍llama2|带有SwiGlu的FeedForward_swiglu mlp-CSDN博客
大模型系列:SwiGLU激活函数与GLU门控线性单元原理解析_mb648c186b9844f的技术博客_51CTO博客
SwiGLU论文阅读-CSDN博客
LLaMA-2 from the Ground Up - by Cameron R. Wolfe, Ph.D.
激活函数的进化之旅:从Sigmoid到SwiGLU,深度学习的神经触发器_ITPUB博客
【大模型】激活函数之SwiGLU详解-CSDN博客
昇腾大模型|结构组件-2——ReLU、GeLU、SwiGLU、GeGLU - 知乎
SwiGLU: GLU Variants Improve Transformer (2020) – Naoki Shibuya
为什么所有主流LLM都使用SwiGLU?_腾讯新闻
SwiGLU: The FFN Upgrade I Use to Get Free Performance - DEV Community
SwiGLU激活函数简要总结 - 知乎
New Swiggle protects children as they take their first net steps - UK ...
SwiGLU在深度学习中到底有什么作用? - 知乎
Building an Efficient Machine Learning API
Gated Linear Units: The FFN Architecture Behind Modern LLMs ...
SwiGLU在神经网络中的作用是什么? - 知乎
大语言模型技术百科:原理、架构与工程实践,第八章:关键组件优化:RMSNorm与SwiGLU - 知乎
The Evolution of Llama: From Llama 1 to Llama 3.1 | Towards Data Science
DeepSeek中的激活函数SwiGLU_ITPUB博客
Exploring the Modern Transformer - From 'Attention Is All You Need' to ...
SwiGLU: The Activation Function Powering Modern LLMs | by Saeed Mehrang ...
SwiGLU激活函数论文:GLU Variants Improve Transformer - 知乎
激活函数-SwiGLU_silu激活函数-CSDN博客
LLaMA模型结构介绍 - 知乎
SwiGLU-capacity/capacity-animations.ipynb at main · timinar/SwiGLU ...
一文图解AF3原理 - 知乎
SwiGLU是一个更好的选择吗? - 知乎
LLaMA Open and Efficient Foundation Language Models - 230528.pdf
一文带你看懂开源大模型基石LLaMA核心技术点,DeepSeek/千问等LLM的模型结构基础-51CTO.COM
神经网络的激活函数(五)门控系列GLU、Swish和SwiGLU - 知乎
Swiggle Search for Kids
激活函数篇(2):SwiGLU | GLU | Swish | ReLU | Sigmoid_swiglu激活函数-CSDN博客
LLaMA explained: KV-Cache, Rotary Positional Embedding, RMS Norm ...
SwiGLU是如何改善神经网络模型效果的? - 知乎
Kids Search Engines That Utilize Google SafeSearch
11 Best Search Engine for Kids in 2025
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码-51CTO.COM
Swiggle (Child-Friendly Search Engine) - Review - Virtual Curiosities
Bloom, the model everyone hates... - Ed's Blog