doxygen/GPUToROCDLPipeline_8cpp_source.html

//===- GPUToROCDLPipeline.cpp - Lowering pipeline to ROCDL/AMDGPU --------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file implements a sink pipeline that lowers a payload containing

// `gpu.launch` / `gpu.module` ops to AMDGPU/ROCDL and emits an AMDGCN binary

// blob via `gpu-module-to-binary`. It is the AMD counterpart of

// `gpu-lower-to-nvvm-pipeline` and `gpu-lower-to-xevm-pipeline`.

//

//===----------------------------------------------------------------------===//


#include "mlir/Conversion/AMDGPUToROCDL/AMDGPUToROCDL.h"

#include "mlir/Conversion/AffineToStandard/AffineToStandard.h"

#include "mlir/Conversion/ArithToLLVM/ArithToLLVM.h"

#include "mlir/Conversion/FuncToLLVM/ConvertFuncToLLVMPass.h"

#include "mlir/Conversion/GPUCommon/GPUCommonPass.h"

#include "mlir/Conversion/GPUToROCDL/GPUToROCDLPass.h"

#include "mlir/Conversion/GPUToROCDL/Runtimes.h"

#include "mlir/Conversion/IndexToLLVM/IndexToLLVM.h"

#include "mlir/Conversion/MathToLLVM/MathToLLVM.h"

#include "mlir/Conversion/ReconcileUnrealizedCasts/ReconcileUnrealizedCasts.h"

#include "mlir/Conversion/SCFToControlFlow/SCFToControlFlow.h"

#include "mlir/Conversion/VectorToSCF/VectorToSCF.h"

#include "mlir/Dialect/GPU/IR/GPUDialect.h"

#include "mlir/Dialect/GPU/Pipelines/Passes.h"

#include "mlir/Dialect/GPU/Transforms/Passes.h"

#include "mlir/Dialect/MemRef/Transforms/Passes.h"

#include "mlir/Pass/PassManager.h"

#include "mlir/Pass/PassOptions.h"

#include "mlir/Transforms/Passes.h"


using namespace mlir;


namespace {


//===----------------------------------------------------------------------===//

// Common pipeline

//===----------------------------------------------------------------------===//

void buildCommonPassPipeline(

    OpPassManager &pm, const mlir::gpu::GPUToROCDLPipelineOptions &options) {

  // Lower AMDGPU dialect ops (e.g. amdgpu.lds_barrier, amdgpu.dpp,

  // amdgpu.mfma, amdgpu.dot, ...) to ROCDL intrinsics first, while they may

  // still live in unout-lined `gpu.launch` bodies. Mirrors the way NVVM's

  // pipeline runs `convert-nvgpu-to-nvvm` before kernel outlining.

  ConvertAMDGPUToROCDLPassOptions amdgpuToROCDLOpt;

  amdgpuToROCDLOpt.chipset = options.chip;

  pm.addPass(createConvertAMDGPUToROCDLPass(amdgpuToROCDLOpt));


  pm.addPass(createGpuKernelOutliningPass());

  pm.addPass(createConvertVectorToSCFPass());

  pm.addPass(createSCFToControlFlowPass());

  pm.addPass(createConvertFuncToLLVMPass());

  pm.addPass(memref::createExpandStridedMetadataPass());


  GpuROCDLAttachTargetOptions rocdlTargetOptions;

  rocdlTargetOptions.triple = options.triple;

  rocdlTargetOptions.chip = options.chip;

  rocdlTargetOptions.features = options.features;

  rocdlTargetOptions.abiVersion = options.abiVersion;

  rocdlTargetOptions.optLevel = options.optLevel;

  rocdlTargetOptions.wave64Flag = options.wave64;

  pm.addPass(createGpuROCDLAttachTarget(rocdlTargetOptions));


  pm.addPass(createLowerAffinePass());

  pm.addPass(createArithToLLVMConversionPass());

  ConvertIndexToLLVMPassOptions convertIndexToLLVMPassOpt;

  convertIndexToLLVMPassOpt.indexBitwidth = options.indexBitWidth;

  pm.addPass(createConvertIndexToLLVMPass(convertIndexToLLVMPassOpt));

  pm.addPass(createCanonicalizerPass());

  pm.addPass(createCSEPass());

}


//===----------------------------------------------------------------------===//

// GPUModule-specific stuff.

//===----------------------------------------------------------------------===//

void buildGpuPassPipeline(OpPassManager &pm,

                          const mlir::gpu::GPUToROCDLPipelineOptions &options) {

  ConvertGpuOpsToROCDLOpsOptions opt;

  opt.chipset = options.chip;

  opt.useBarePtrCallConv = options.kernelUseBarePtrCallConv;

  opt.indexBitwidth = options.indexBitWidth;

  // Always declare HIP as the runtime so that gpu.printf etc. lower to the

  // matching runtime entry points exposed by `libmlir_rocm_runtime.so`.

  opt.runtime = mlir::gpu::amd::Runtime::HIP;

  pm.addNestedPass<gpu::GPUModuleOp>(createConvertGpuOpsToROCDLOps(opt));

  pm.addNestedPass<gpu::GPUModuleOp>(createCanonicalizerPass());

  pm.addNestedPass<gpu::GPUModuleOp>(createCSEPass());

  pm.addNestedPass<gpu::GPUModuleOp>(createReconcileUnrealizedCastsPass());

}


//===----------------------------------------------------------------------===//

// Host Post-GPU pipeline

//===----------------------------------------------------------------------===//

void buildHostPostPipeline(

    OpPassManager &pm, const mlir::gpu::GPUToROCDLPipelineOptions &options) {

  GpuToLLVMConversionPassOptions opt;

  opt.hostBarePtrCallConv = options.hostUseBarePtrCallConv;

  opt.kernelBarePtrCallConv = options.kernelUseBarePtrCallConv;

  pm.addPass(createGpuToLLVMConversionPass(opt));


  GpuModuleToBinaryPassOptions gpuModuleToBinaryPassOptions;

  gpuModuleToBinaryPassOptions.compilationTarget = options.binaryFormat;

  gpuModuleToBinaryPassOptions.cmdOptions = options.cmdOptions;

  pm.addPass(createGpuModuleToBinaryPass(gpuModuleToBinaryPassOptions));

  pm.addPass(createConvertMathToLLVMPass());

  pm.addPass(createCanonicalizerPass());

  pm.addPass(createCSEPass());

  pm.addPass(createReconcileUnrealizedCastsPass());

}


} // namespace


void mlir::gpu::buildLowerToROCDLPassPipeline(

    OpPassManager &pm, const GPUToROCDLPipelineOptions &options) {

  // Common pipelines

  buildCommonPassPipeline(pm, options);


  // GPUModule-specific stuff

  buildGpuPassPipeline(pm, options);


  // Host post-GPUModule-specific stuff

  buildHostPostPipeline(pm, options);

}


void mlir::gpu::registerGPUToROCDLPipeline() {

  PassPipelineRegistration<GPUToROCDLPipelineOptions>(

      "gpu-lower-to-rocdl-pipeline",

      "The default pipeline lowers main dialects (arith, memref, scf, vector, "

      "gpu) to ROCDL. It starts by lowering GPU code to the specified "

      "compilation target (default is fatbin) then lowers the host code.",

      buildLowerToROCDLPassPipeline);

}


AMDGPUToROCDL.h

AffineToStandard.h

ArithToLLVM.h

ConvertFuncToLLVMPass.h

Passes.h

Passes.h

Passes.h

GPUCommonPass.h

GPUDialect.h

GPUToROCDLPass.h

IndexToLLVM.h

MathToLLVM.h

options
static llvm::ManagedStatic< PassManagerOptions > options
Definition PassManagerOptions.cpp:89

PassManager.h

PassOptions.h

ReconcileUnrealizedCasts.h

Runtimes.h

SCFToControlFlow.h

Passes.h

VectorToSCF.h

mlir::OpPassManager
This class represents a pass manager that runs passes on either a specific operation type,...
Definition PassManager.h:46

mlir::OpPassManager::addPass
void addPass(std::unique_ptr< Pass > pass)
Add the given pass to this pass manager.
Definition Pass.cpp:392

mlir::OpPassManager::addNestedPass
void addNestedPass(std::unique_ptr< Pass > pass)
Add the given pass to a nested pass manager for the given operation kind OpT.
Definition PassManager.h:115

mlir::gpu::amd::HIP
@ HIP
Definition Runtimes.h:17

mlir::gpu::registerGPUToROCDLPipeline
void registerGPUToROCDLPipeline()
Definition GPUToROCDLPipeline.cpp:129

mlir::gpu::buildLowerToROCDLPassPipeline
void buildLowerToROCDLPassPipeline(OpPassManager &pm, const GPUToROCDLPipelineOptions &options)
Adds the GPU to ROCDL pipeline to the given pass manager.
Definition GPUToROCDLPipeline.cpp:117

mlir::memref::createExpandStridedMetadataPass
std::unique_ptr<::mlir::Pass > createExpandStridedMetadataPass()
Definition ExpandStridedMetadata.cpp:337

mlir
Include the generated interface declarations.
Definition ABIRewriteContext.h:29

mlir::createSCFToControlFlowPass
std::unique_ptr<::mlir::Pass > createSCFToControlFlowPass()
Definition SCFToControlFlow.cpp:6422

mlir::createConvertMathToLLVMPass
std::unique_ptr<::mlir::Pass > createConvertMathToLLVMPass()
Definition MathToLLVM.cpp:3018

mlir::createConvertFuncToLLVMPass
std::unique_ptr<::mlir::Pass > createConvertFuncToLLVMPass()
Definition FuncToLLVM.cpp:1969

mlir::createConvertIndexToLLVMPass
std::unique_ptr<::mlir::Pass > createConvertIndexToLLVMPass()
Definition IndexToLLVM.cpp:2551

mlir::createReconcileUnrealizedCastsPass
std::unique_ptr<::mlir::Pass > createReconcileUnrealizedCastsPass()
Definition ReconcileUnrealizedCasts.cpp:6331

mlir::createArithToLLVMConversionPass
std::unique_ptr<::mlir::Pass > createArithToLLVMConversionPass()
Definition ArithToLLVM.cpp:433

mlir::createCanonicalizerPass
std::unique_ptr<::mlir::Pass > createCanonicalizerPass()
Definition Canonicalizer.cpp:299

mlir::createLowerAffinePass
std::unique_ptr<::mlir::Pass > createLowerAffinePass()
Definition AffineToStandard.cpp:6036

mlir::createGpuROCDLAttachTarget
std::unique_ptr<::mlir::Pass > createGpuROCDLAttachTarget()
Definition ROCDLAttachTarget.cpp:868

mlir::createConvertGpuOpsToROCDLOps
std::unique_ptr<::mlir::Pass > createConvertGpuOpsToROCDLOps()
Definition LowerGpuOpsToROCDLOps.cpp:2456

mlir::createConvertAMDGPUToROCDLPass
std::unique_ptr<::mlir::Pass > createConvertAMDGPUToROCDLPass()
Definition AMDGPUToROCDL.cpp:529

mlir::createGpuToLLVMConversionPass
std::unique_ptr<::mlir::Pass > createGpuToLLVMConversionPass()
Definition GPUToLLVMConversion.cpp:5876

mlir::createGpuModuleToBinaryPass
std::unique_ptr<::mlir::Pass > createGpuModuleToBinaryPass()
Definition ModuleToBinary.cpp:612

mlir::createConvertVectorToSCFPass
std::unique_ptr< Pass > createConvertVectorToSCFPass(const VectorTransferToSCFOptions &options=VectorTransferToSCFOptions())
Create a pass to convert a subset of vector ops to SCF.
Definition VectorToSCF.cpp:1758

mlir::createCSEPass
std::unique_ptr<::mlir::Pass > createCSEPass()
Definition CSE.cpp:177

mlir::createGpuKernelOutliningPass
std::unique_ptr<::mlir::Pass > createGpuKernelOutliningPass()
Definition KernelOutlining.cpp:335

mlir::ConvertAMDGPUToROCDLPassOptions
Definition AMDGPUToROCDL.h:447

mlir::ConvertAMDGPUToROCDLPassOptions::chipset
std::string chipset
Definition AMDGPUToROCDL.h:448

mlir::ConvertGpuOpsToROCDLOpsOptions
Definition GPUToROCDLPass.h:2355

mlir::ConvertGpuOpsToROCDLOpsOptions::indexBitwidth
unsigned indexBitwidth
Definition GPUToROCDLPass.h:2357

mlir::ConvertGpuOpsToROCDLOpsOptions::useBarePtrCallConv
bool useBarePtrCallConv
Definition GPUToROCDLPass.h:2358

mlir::ConvertGpuOpsToROCDLOpsOptions::chipset
std::string chipset
Definition GPUToROCDLPass.h:2356

mlir::ConvertGpuOpsToROCDLOpsOptions::runtime
::mlir::gpu::amd::Runtime runtime
Definition GPUToROCDLPass.h:2359

mlir::ConvertIndexToLLVMPassOptions
Definition IndexToLLVM.h:2470

mlir::ConvertIndexToLLVMPassOptions::indexBitwidth
unsigned indexBitwidth
Definition IndexToLLVM.h:2471

mlir::GpuModuleToBinaryPassOptions
Definition Passes.h:519

mlir::GpuModuleToBinaryPassOptions::compilationTarget
std::string compilationTarget
Definition Passes.h:523

mlir::GpuModuleToBinaryPassOptions::cmdOptions
std::string cmdOptions
Definition Passes.h:522

mlir::GpuROCDLAttachTargetOptions
Definition Passes.h:751

mlir::GpuROCDLAttachTargetOptions::triple
std::string triple
Definition Passes.h:753

mlir::GpuROCDLAttachTargetOptions::optLevel
unsigned optLevel
Definition Passes.h:757

mlir::GpuROCDLAttachTargetOptions::chip
std::string chip
Definition Passes.h:754

mlir::GpuROCDLAttachTargetOptions::abiVersion
std::string abiVersion
Definition Passes.h:756

mlir::GpuROCDLAttachTargetOptions::features
std::string features
Definition Passes.h:755

mlir::GpuROCDLAttachTargetOptions::wave64Flag
bool wave64Flag
Definition Passes.h:758

mlir::GpuToLLVMConversionPassOptions
Definition GPUCommonPass.h:5788

mlir::GpuToLLVMConversionPassOptions::hostBarePtrCallConv
bool hostBarePtrCallConv
Definition GPUCommonPass.h:5789

mlir::GpuToLLVMConversionPassOptions::kernelBarePtrCallConv
bool kernelBarePtrCallConv
Definition GPUCommonPass.h:5790

mlir::PassPipelineRegistration
PassPipelineRegistration provides a global initializer that registers a Pass pipeline builder routine...
Definition PassRegistry.h:177

mlir::gpu::GPUToROCDLPipelineOptions
Options for the gpu to rocdl pipeline.
Definition Passes.h:69