doxygen/NVGPUDialect_8h_source.html

 //===- NVGPUDialect.h - MLIR Dialect for NVGPU ------------------*- C++ -*-===//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//

 //

 // This file declares the Target dialect for NVGPU in MLIR.

 //

 //===----------------------------------------------------------------------===//


 #ifndef MLIR_DIALECT_NVGPU_NVGPUDIALECT_H_

 #define MLIR_DIALECT_NVGPU_NVGPUDIALECT_H_


 #include "mlir/Bytecode/BytecodeOpInterface.h"

 #include "mlir/IR/BuiltinTypes.h"

 #include "mlir/IR/Dialect.h"

 #include "mlir/IR/OpDefinition.h"

 #include "mlir/Interfaces/InferTypeOpInterface.h"

 #include "mlir/Interfaces/SideEffectInterfaces.h"


 #include "mlir/Dialect/NVGPU/IR/NVGPUEnums.h.inc"


 // Maximum warp size

 constexpr int kWarpSize = 32;


 // Maximum number of threads in a block and block in a grid

 // https://docs.nvidia.com/cuda/cuda-c-programming-guide/#features-and-technical-specifications-technical-specifications-per-compute-capability

 constexpr int kMaxTotalBlockdim = 1024;

 constexpr int kMaxBlockdimx = 1024;

 constexpr int kMaxBlockdimy = 1024;

 constexpr int kMaxBlockdimz = 64;

 constexpr int kMaxTotalGriddim = 2147483647;

 constexpr int kMaxGriddimx = 2147483647;

 constexpr int kMaxGriddimy = 65535;

 constexpr int kMaxGriddimz = 65535;


 /// M size of wgmma.mma_async instruction

 constexpr int kWgmmaSizeM = 64;


 /// Maximum TMA tile dimension (tensorRank) must be non-zero and less than or

 /// equal to the maximum supported dimensionality of 5.

 constexpr unsigned kMaxTMATensorDimension = 5;

 /// Maximum TMA tile size (boxDim), which specifies number of elements

 /// to be traversed along each of the kMaxTMATensorDimension (tensorRank)

 /// dimensions, must be non-zero and less than or equal to 256.

 constexpr unsigned kMaxTMADimension = 256;

 /// Last dimension of 2D+ TMA must be 128 bytes

 constexpr unsigned kMaxTMALastdimByte = 128;


 #define GET_ATTRDEF_CLASSES

 #include "mlir/Dialect/NVGPU/IR/NVGPUAttrDefs.h.inc"


 #define GET_TYPEDEF_CLASSES

 #include "mlir/Dialect/NVGPU/IR/NVGPUTypeDefs.h.inc"


 #include "mlir/Dialect/NVGPU/IR/NVGPUDialect.h.inc"


 #define GET_OP_CLASSES

 #include "mlir/Dialect/NVGPU/IR/NVGPUOps.h.inc"


 #endif // MLIR_DIALECT_NVGPU_NVGPUDIALECT_H_

BytecodeOpInterface.h

Dialect.h

InferTypeOpInterface.h

kMaxGriddimz
constexpr int kMaxGriddimz
Definition: NVGPUDialect.h:37

kMaxTotalBlockdim
constexpr int kMaxTotalBlockdim
Definition: NVGPUDialect.h:30

kWgmmaSizeM
constexpr int kWgmmaSizeM
M size of wgmma.mma_async instruction.
Definition: NVGPUDialect.h:40

kWarpSize
constexpr int kWarpSize
Definition: NVGPUDialect.h:26

kMaxGriddimy
constexpr int kMaxGriddimy
Definition: NVGPUDialect.h:36

kMaxTMATensorDimension
constexpr unsigned kMaxTMATensorDimension
Maximum TMA tile dimension (tensorRank) must be non-zero and less than or equal to the maximum suppor...
Definition: NVGPUDialect.h:44

kMaxBlockdimx
constexpr int kMaxBlockdimx
Definition: NVGPUDialect.h:31

kMaxBlockdimz
constexpr int kMaxBlockdimz
Definition: NVGPUDialect.h:33

kMaxGriddimx
constexpr int kMaxGriddimx
Definition: NVGPUDialect.h:35

kMaxTMADimension
constexpr unsigned kMaxTMADimension
Maximum TMA tile size (boxDim), which specifies number of elements to be traversed along each of the ...
Definition: NVGPUDialect.h:48

kMaxBlockdimy
constexpr int kMaxBlockdimy
Definition: NVGPUDialect.h:32

kMaxTMALastdimByte
constexpr unsigned kMaxTMALastdimByte
Last dimension of 2D+ TMA must be 128 bytes.
Definition: NVGPUDialect.h:50

kMaxTotalGriddim
constexpr int kMaxTotalGriddim
Definition: NVGPUDialect.h:34

OpDefinition.h

SideEffectInterfaces.h

BuiltinTypes.h