NVTX 原理分析
约 1 分钟阅读
1. 与 Runtime 交互
参考代码位置:
- C/C++ 头文件:
c/include/nvtx3 - 示例注入:
tools/sample-injection
flowchart TD
A[应用程序<br>调用 NVTX API] --> B[NVTX 分发层<br>Header-only]
B -->|首次调用| C{找到注入库?}
C -- 否 --> D[函数指针为空<br>直接返回<br>≈零开销]
C -- 是 --> E[初始化回调表<br>填充函数指针]
E --> F[后续 API<br>直接经指针跳转]
F --> G[工具实现层<br>记录/统计/转发]
应用程序调用 nvtxRangePushA("foo")
↓
NVTX 运行时检查是否有注入库
↓
首次调用时加载注入库,调用 InitializeInjectionNvtx2()
↓
注入库填充回调表
↓
后续调用直接路由到注入库的 impl::RangePushA() 修改历史3 次提交
- refactor: reorganize documentation structure and update Navbar componentxiaocheng··
2fb8f42 - chore(project): clean up obsolete configuration and build artifactsxiaocheng··
3574bd3 - feat: add profiling docs for AI tracing and critical pathsxiaocheng··
fd52202
相关阅读
基于标签与分类02. Reasoning Model、Agent 与长任务
reasoning model 和普通模型有什么区别?为什么模型知道很多却一推就错?为什么接上工具后小模型短任务聪明、长任务却容易崩?
AI 系统
01. 什么是 AI 推理
从新手视角解释 AI 推理的基本概念:推理和记忆的区别、token 生成与推理的关系、演绎归纳溯因,以及什么样的问题真正考验推理。
AI 系统
AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent
从新手视角梳理 AI 推理的核心概念:推理与记忆的区别、思维链、reasoning model、RAG、memory、fine-tuning、distillation,以及推理能力和 agent 能力的关系。
AI 系统