ROCm rocr-libhsakmt性能跟踪与分析系列10-1:概述
1. 引言性能分析是优化GPU应用程序的关键环节。ROCm通过hsakmt层提供了完整的性能计数器pmc(Performance Counter)管理机制,允许开发者监控GPU硬件的运行状态,收集性能数据,从而定位性能瓶颈。本文档作为系列文章的第一篇,将介绍ROCm rocr里的性能跟踪与分析的整体架构、核心概念和典型使用流程。2. 架构概览2.1 系统层次结构ROCm性能跟踪系统采用分层架构:+-----------------------------------+ | 用户应用层 (User Application) | | - ROCProfiler | | - 自定义分析工具 | +-----------------------------------+ ↓ HSA API +-----------------------------------+ | HSA KMT API Layer | | - hsaKmtPmcGetCounterProperties | | - hsaKmtPmcRegisterTrace | | - hsaKmtPmcStartTrace | | - hsaKmtPmcQueryTrace | | - hsaKmtPmcStopTrace | +-------