doxygen/MmaSyncTF32Transform_8cpp_source.html

 //===- OptimizeSharedMemory.cpp - MLIR NVGPU pass implementation ----------===//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//

 //

 // This file implements transforms to enable 1xtf32 and 3xtf32 nvgpu.mma sync

 // operations on f32 input datatype

 //

 //===----------------------------------------------------------------------===//


 #include "mlir/Dialect/NVGPU/Transforms/Transforms.h"


 #include "mlir/Dialect/MemRef/IR/MemRef.h"

 #include "mlir/Dialect/NVGPU/IR/NVGPUDialect.h"

 #include "mlir/Dialect/Vector/IR/VectorOps.h"


 using namespace mlir;

 using namespace mlir::nvgpu;


 namespace {


 struct MmaSyncF32ToTF32Pattern : public OpRewritePattern<nvgpu::MmaSyncOp> {


   using OpRewritePattern<nvgpu::MmaSyncOp>::OpRewritePattern;


   MmaSyncF32ToTF32Pattern(MLIRContext *context,

                           nvgpu::MmaSyncF32Lowering precision)

       : OpRewritePattern<nvgpu::MmaSyncOp>(context, /*benifit*/ 1),

         precision(precision) {}


   LogicalResult matchAndRewrite(nvgpu::MmaSyncOp op,

                                 PatternRewriter &rewriter) const override {

     Location location = op->getLoc();


     if (op->hasAttr(op.getTf32EnabledAttrName()) ||

         !cast<VectorType>(op.getMatrixA().getType()).getElementType().isF32())

       return failure();


     if (precision == MmaSyncF32Lowering::Unkown)

       return emitError(location, "MmaSync F32-to-TF32 cannot be lowered with "

                                  "unknown precision level");


     if (precision == MmaSyncF32Lowering::TF32x3)

       return emitError(location, "TF32x3 is not supported at the moment "

                                  "for nvgpu.mma.sync on f32 datatype");


     if (precision == MmaSyncF32Lowering::TF32) {

       rewriter.modifyOpInPlace(

           op, [&]() { op.setTf32EnabledAttr(rewriter.getUnitAttr()); });

     }


     return success();

   }


 private:

   /// Precision for F32 Tensor Cores (TF32 or TF32x3)

   nvgpu::MmaSyncF32Lowering precision;

 };


 } // namespace


 void mlir::nvgpu::populateMmaSyncF32ToTF32Patterns(

     RewritePatternSet &patterns, nvgpu::MmaSyncF32Lowering precision) {


   patterns.add<MmaSyncF32ToTF32Pattern>(patterns.getContext(), precision);

 }

NVGPUDialect.h

VectorOps.h

mlir::Builder::getUnitAttr
UnitAttr getUnitAttr()
Definition: Builders.cpp:93

mlir::Location
This class defines the main interface for locations in MLIR and acts as a non-nullable wrapper around...
Definition: Location.h:76

mlir::MLIRContext
MLIRContext is the top-level object for a collection of MLIR operations.
Definition: MLIRContext.h:60

mlir::PatternRewriter
A special type of RewriterBase that coordinates the application of a rewrite pattern on the current I...
Definition: PatternMatch.h:769

mlir::RewritePatternSet
Definition: PatternMatch.h:792

mlir::RewriterBase::modifyOpInPlace
void modifyOpInPlace(Operation *root, CallableT &&callable)
This method is a utility wrapper around an in-place modification of an operation.
Definition: PatternMatch.h:614

MemRef.h

Transforms.h

mlir::nvgpu
Definition: NVGPUToNVVM.h:25

mlir::nvgpu::MmaSyncF32Lowering
MmaSyncF32Lowering
Rewrites patterns.
Definition: Transforms.h:57

mlir::nvgpu::MmaSyncF32Lowering::Unkown
@ Unkown

mlir::nvgpu::MmaSyncF32Lowering::TF32
@ TF32

mlir::nvgpu::MmaSyncF32Lowering::TF32x3
@ TF32x3

mlir::nvgpu::populateMmaSyncF32ToTF32Patterns
void populateMmaSyncF32ToTF32Patterns(RewritePatternSet &patterns, nvgpu::MmaSyncF32Lowering precision=nvgpu::MmaSyncF32Lowering::TF32)
Collect patterns to convert mma.sync on f32 input and rewrite to use tensor cores with user provided ...
Definition: MmaSyncTF32Transform.cpp:65

mlir
Include the generated interface declarations.
Definition: LocalAliasAnalysis.h:20

mlir::emitError
InFlightDiagnostic emitError(Location loc)
Utility method to emit an error message using this location.
Definition: Diagnostics.cpp:328

mlir::patterns
const FrozenRewritePatternSet & patterns
Definition: GreedyPatternRewriteDriver.h:283

mlir::OpRewritePattern
OpRewritePattern is a wrapper around RewritePattern that allows for matching and rewriting against an...
Definition: PatternMatch.h:314