Profiling
Profiling
9 篇文章
文章
01
AWP 六维 Breakdown 框架与能力体系摘要
对 AWP 平台规模化 Profiling 驱动的 GPU 效率六维 Breakdown 框架与四级能力体系的摘要
02
LLM 推理性能优化与 GPU 利用率提升摘要
对 LLM 推理性能优化全链路方法论的摘要,覆盖根因诊断、AWP Profiling 定位、六层优化方案与业界案例
03
GPU Trace 时间分解与通信计算重叠分析
详解 GPU 性能分析中的区间合并、扫描线算法原理,以及 Temporal Breakdown 和 Overlap Analysis 两个核心分析模块的计算逻辑
04
Cprof C++ Profiling 核心技术
05
Temporal Breakdown 计算分析
06
HTA 算法原理与实现
深入分析 Holistic Trace Analysis (HTA) 的核心算法原理、数据结构设计和关键实现细节。
07
NVTX 原理分析
08
Critical Path of AI Trace
GPU kernel trace/timeline 的关键路径算法原理、业界工具实践(HTA / NCU / NSYS)及实现思路。
09
Python AI Profiling
相关阅读
基于标签与分类02. Reasoning Model、Agent 与长任务
reasoning model 和普通模型有什么区别?为什么模型知道很多却一推就错?为什么接上工具后小模型短任务聪明、长任务却容易崩?
AI 系统
01. 什么是 AI 推理
从新手视角解释 AI 推理的基本概念:推理和记忆的区别、token 生成与推理的关系、演绎归纳溯因,以及什么样的问题真正考验推理。
AI 系统
AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent
从新手视角梳理 AI 推理的核心概念:推理与记忆的区别、思维链、reasoning model、RAG、memory、fine-tuning、distillation,以及推理能力和 agent 能力的关系。
AI 系统