Gpu Computing
Gpu Computing
6 篇文章
文章
01
README
02
CUDA Agent
论文精读 — CUDA Agent 通过大规模 Agentic 强化学习系统,让 LLM 学会自主编写和优化 CUDA kernel,在 KernelBench 上全面超越 torch.compile 和顶级闭源模型
03
PTX 技术详解
深入解析 NVIDIA PTX 中间表示语言,涵盖 GPU 架构、SIMT 执行模型、编译流程及性能优化
04
SAC: Sharing-Aware Caching in Multi-Chip GPUs
论文精读 — SAC 通过动态重配置 LLC 路由策略,根据跨芯片数据共享特征在 memory-side 和 SM-side LLC 组织方式间切换,在多芯片 GPU 上实现平均 63% 的性能提升
05
GPU Communication
06
GPU Architecture Deep Dive
系统性解析现代GPU架构设计原理,涵盖SIMT执行模型、SM微架构、内存层次结构及线程调度机制
相关阅读
基于标签与分类02. Reasoning Model、Agent 与长任务
reasoning model 和普通模型有什么区别?为什么模型知道很多却一推就错?为什么接上工具后小模型短任务聪明、长任务却容易崩?
AI 系统
01. 什么是 AI 推理
从新手视角解释 AI 推理的基本概念:推理和记忆的区别、token 生成与推理的关系、演绎归纳溯因,以及什么样的问题真正考验推理。
AI 系统
AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent
从新手视角梳理 AI 推理的核心概念:推理与记忆的区别、思维链、reasoning model、RAG、memory、fine-tuning、distillation,以及推理能力和 agent 能力的关系。
AI 系统