doxygen/MemRef_2Transforms_2FoldMemRefAliasOps_8cpp_source.html

//===- FoldMemRefAliasOps.cpp - Fold memref alias ops -----===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This transformation pass folds loading/storing from/to subview ops into

// loading/storing from/to the original memref.

//

//===----------------------------------------------------------------------===//


#include "mlir/Dialect/Affine/ViewLikeInterfaceUtils.h"

#include "mlir/Dialect/Arith/Utils/Utils.h"

#include "mlir/Dialect/GPU/IR/GPUDialect.h"

#include "mlir/Dialect/MemRef/IR/MemRef.h"

#include "mlir/Dialect/MemRef/Transforms/Passes.h"

#include "mlir/Dialect/MemRef/Transforms/Transforms.h"

#include "mlir/Dialect/MemRef/Utils/MemRefUtils.h"

#include "mlir/Dialect/NVGPU/IR/NVGPUDialect.h"

#include "mlir/Dialect/Vector/IR/VectorOps.h"

#include "mlir/IR/AffineMap.h"

#include "mlir/Transforms/GreedyPatternRewriteDriver.h"

#include "llvm/ADT/STLExtras.h"

#include "llvm/ADT/SmallBitVector.h"

#include "llvm/ADT/TypeSwitch.h"

#include "llvm/Support/Debug.h"


#define DEBUG_TYPE "fold-memref-alias-ops"

#define DBGS() (llvm::dbgs() << "[" DEBUG_TYPE "]: ")


namespace mlir {

namespace memref {

#define GEN_PASS_DEF_FOLDMEMREFALIASOPSPASS

#include "mlir/Dialect/MemRef/Transforms/Passes.h.inc"

} // namespace memref

} // namespace mlir


using namespace mlir;


//===----------------------------------------------------------------------===//

// Utility functions

//===----------------------------------------------------------------------===//


/// Helpers to access the memref operand for each op.

template <typename LoadOrStoreOpTy>


static Value getMemRefOperand(LoadOrStoreOpTy op) {

  return op.getMemref();

}


static Value getMemRefOperand(vector::TransferReadOp op) {

  return op.getBase();

}


static Value getMemRefOperand(nvgpu::LdMatrixOp op) {

  return op.getSrcMemref();

}


static Value getMemRefOperand(vector::LoadOp op) { return op.getBase(); }


static Value getMemRefOperand(vector::StoreOp op) { return op.getBase(); }


static Value getMemRefOperand(vector::MaskedLoadOp op) { return op.getBase(); }


static Value getMemRefOperand(vector::MaskedStoreOp op) { return op.getBase(); }


static Value getMemRefOperand(vector::TransferWriteOp op) {

  return op.getBase();

}


static Value getMemRefOperand(gpu::SubgroupMmaLoadMatrixOp op) {

  return op.getSrcMemref();

}


static Value getMemRefOperand(gpu::SubgroupMmaStoreMatrixOp op) {

  return op.getDstMemref();

}


//===----------------------------------------------------------------------===//

// Patterns

//===----------------------------------------------------------------------===//


namespace {

/// Merges subview operation with load/transferRead operation.

template <typename OpTy>

class LoadOpOfSubViewOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy loadOp,

                                PatternRewriter &rewriter) const override;

};


/// Merges expand_shape operation with load/transferRead operation.

template <typename OpTy>

class LoadOpOfExpandShapeOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy loadOp,

                                PatternRewriter &rewriter) const override;

};


/// Merges collapse_shape operation with load/transferRead operation.

template <typename OpTy>

class LoadOpOfCollapseShapeOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy loadOp,

                                PatternRewriter &rewriter) const override;

};


/// Merges subview operation with store/transferWriteOp operation.

template <typename OpTy>

class StoreOpOfSubViewOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy storeOp,

                                PatternRewriter &rewriter) const override;

};


/// Merges expand_shape operation with store/transferWriteOp operation.

template <typename OpTy>

class StoreOpOfExpandShapeOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy storeOp,

                                PatternRewriter &rewriter) const override;

};


/// Merges collapse_shape operation with store/transferWriteOp operation.

template <typename OpTy>

class StoreOpOfCollapseShapeOpFolder final : public OpRewritePattern<OpTy> {

public:

  using OpRewritePattern<OpTy>::OpRewritePattern;


  LogicalResult matchAndRewrite(OpTy storeOp,

                                PatternRewriter &rewriter) const override;

};


/// Folds subview(subview(x)) to a single subview(x).

class SubViewOfSubViewFolder : public OpRewritePattern<memref::SubViewOp> {

public:

  using OpRewritePattern<memref::SubViewOp>::OpRewritePattern;


  LogicalResult matchAndRewrite(memref::SubViewOp subView,

                                PatternRewriter &rewriter) const override {

    auto srcSubView = subView.getSource().getDefiningOp<memref::SubViewOp>();

    if (!srcSubView)

      return failure();


    // TODO: relax unit stride assumption.

    if (!subView.hasUnitStride()) {

      return rewriter.notifyMatchFailure(subView, "requires unit strides");

    }

    if (!srcSubView.hasUnitStride()) {

      return rewriter.notifyMatchFailure(srcSubView, "requires unit strides");

    }


    // Resolve sizes according to dropped dims.

    SmallVector<OpFoldResult> resolvedSizes;

    llvm::SmallBitVector srcDroppedDims = srcSubView.getDroppedDims();

    affine::resolveSizesIntoOpWithSizes(srcSubView.getMixedSizes(),

                                        subView.getMixedSizes(), srcDroppedDims,

                                        resolvedSizes);


    // Resolve offsets according to source offsets and strides.

    SmallVector<Value> resolvedOffsets;

    affine::resolveIndicesIntoOpWithOffsetsAndStrides(

        rewriter, subView.getLoc(), srcSubView.getMixedOffsets(),

        srcSubView.getMixedStrides(), srcDroppedDims, subView.getMixedOffsets(),

        resolvedOffsets);


    // Replace original op.

    rewriter.replaceOpWithNewOp<memref::SubViewOp>(

        subView, subView.getType(), srcSubView.getSource(),

        getAsOpFoldResult(resolvedOffsets), resolvedSizes,

        srcSubView.getMixedStrides());


    return success();

  }

};


/// Folds nvgpu.device_async_copy subviews into the copy itself. This pattern

/// is folds subview on src and dst memref of the copy.

class NVGPUAsyncCopyOpSubViewOpFolder final

    : public OpRewritePattern<nvgpu::DeviceAsyncCopyOp> {

public:

  using OpRewritePattern<nvgpu::DeviceAsyncCopyOp>::OpRewritePattern;


  LogicalResult matchAndRewrite(nvgpu::DeviceAsyncCopyOp copyOp,

                                PatternRewriter &rewriter) const override;

};

} // namespace


template <typename XferOp>

static LogicalResult


preconditionsFoldSubViewOpImpl(RewriterBase &rewriter, XferOp xferOp,

                               memref::SubViewOp subviewOp) {

  static_assert(

      !llvm::is_one_of<vector::TransferReadOp, vector::TransferWriteOp>::value,

      "must be a vector transfer op");

  if (xferOp.hasOutOfBoundsDim())

    return rewriter.notifyMatchFailure(xferOp, "out of bounds transfer dim");

  if (!subviewOp.hasUnitStride()) {

    return rewriter.notifyMatchFailure(

        xferOp, "non-1 stride subview, need to track strides in folded memref");

  }

  return success();

}


static LogicalResult preconditionsFoldSubViewOp(RewriterBase &rewriter,

                                                Operation *op,

                                                memref::SubViewOp subviewOp) {

  return success();

}


static LogicalResult preconditionsFoldSubViewOp(RewriterBase &rewriter,

                                                vector::TransferReadOp readOp,

                                                memref::SubViewOp subviewOp) {

  return preconditionsFoldSubViewOpImpl(rewriter, readOp, subviewOp);

}


static LogicalResult preconditionsFoldSubViewOp(RewriterBase &rewriter,

                                                vector::TransferWriteOp writeOp,

                                                memref::SubViewOp subviewOp) {

  return preconditionsFoldSubViewOpImpl(rewriter, writeOp, subviewOp);

}


template <typename OpTy>

LogicalResult LoadOpOfSubViewOpFolder<OpTy>::matchAndRewrite(

    OpTy loadOp, PatternRewriter &rewriter) const {

  auto subViewOp =

      getMemRefOperand(loadOp).template getDefiningOp<memref::SubViewOp>();


  if (!subViewOp)

    return rewriter.notifyMatchFailure(loadOp, "not a subview producer");


  LogicalResult preconditionResult =

      preconditionsFoldSubViewOp(rewriter, loadOp, subViewOp);

  if (failed(preconditionResult))

    return preconditionResult;


  SmallVector<Value> sourceIndices;

  affine::resolveIndicesIntoOpWithOffsetsAndStrides(

      rewriter, loadOp.getLoc(), subViewOp.getMixedOffsets(),

      subViewOp.getMixedStrides(), subViewOp.getDroppedDims(),

      loadOp.getIndices(), sourceIndices);


  llvm::TypeSwitch<Operation *, void>(loadOp)

      .Case([&](memref::LoadOp op) {

        rewriter.replaceOpWithNewOp<memref::LoadOp>(

            loadOp, subViewOp.getSource(), sourceIndices, op.getNontemporal());

      })

      .Case([&](vector::LoadOp op) {

        rewriter.replaceOpWithNewOp<vector::LoadOp>(

            op, op.getType(), subViewOp.getSource(), sourceIndices);

      })

      .Case([&](vector::MaskedLoadOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedLoadOp>(

            op, op.getType(), subViewOp.getSource(), sourceIndices,

            op.getMask(), op.getPassThru());

      })

      .Case([&](vector::TransferReadOp op) {

        rewriter.replaceOpWithNewOp<vector::TransferReadOp>(

            op, op.getVectorType(), subViewOp.getSource(), sourceIndices,

            AffineMapAttr::get(expandDimsToRank(

                op.getPermutationMap(), subViewOp.getSourceType().getRank(),

                subViewOp.getDroppedDims())),

            op.getPadding(), op.getMask(), op.getInBoundsAttr());

      })

      .Case([&](gpu::SubgroupMmaLoadMatrixOp op) {

        rewriter.replaceOpWithNewOp<gpu::SubgroupMmaLoadMatrixOp>(

            op, op.getType(), subViewOp.getSource(), sourceIndices,

            op.getLeadDimension(), op.getTransposeAttr());

      })

      .Case([&](nvgpu::LdMatrixOp op) {

        rewriter.replaceOpWithNewOp<nvgpu::LdMatrixOp>(

            op, op.getType(), subViewOp.getSource(), sourceIndices,

            op.getTranspose(), op.getNumTiles());

      })

      .DefaultUnreachable("unexpected operation");

  return success();

}


template <typename OpTy>

LogicalResult LoadOpOfExpandShapeOpFolder<OpTy>::matchAndRewrite(

    OpTy loadOp, PatternRewriter &rewriter) const {

  auto expandShapeOp =

      getMemRefOperand(loadOp).template getDefiningOp<memref::ExpandShapeOp>();


  if (!expandShapeOp)

    return failure();


  SmallVector<Value> sourceIndices;

  // memref.load guarantees that indexes start inbounds while the vector

  // operations don't. This impacts if our linearization is `disjoint`

  resolveSourceIndicesExpandShape(loadOp.getLoc(), rewriter, expandShapeOp,

                                  loadOp.getIndices(), sourceIndices,

                                  isa<memref::LoadOp>(loadOp.getOperation()));


  return llvm::TypeSwitch<Operation *, LogicalResult>(loadOp)

      .Case([&](memref::LoadOp op) {

        rewriter.replaceOpWithNewOp<memref::LoadOp>(

            loadOp, expandShapeOp.getViewSource(), sourceIndices,

            op.getNontemporal());

        return success();

      })

      .Case([&](vector::LoadOp op) {

        rewriter.replaceOpWithNewOp<vector::LoadOp>(

            op, op.getType(), expandShapeOp.getViewSource(), sourceIndices,

            op.getNontemporal());

        return success();

      })

      .Case([&](vector::MaskedLoadOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedLoadOp>(

            op, op.getType(), expandShapeOp.getViewSource(), sourceIndices,

            op.getMask(), op.getPassThru());

        return success();

      })

      .Case([&](vector::TransferReadOp op) {

        // We only support the case where the source of the expand shape has

        // rank greater than or equal to the vector rank.

        const int64_t vectorRank = op.getVectorType().getRank();

        const int64_t sourceRank = sourceIndices.size();

        if (sourceRank < vectorRank)

          return failure();


        SmallVector<AffineExpr> newResults;

        // We can only fold if the permutation map uses only the least

        // significant dimension from an expanded shape.

        for (AffineExpr result : op.getPermutationMap().getResults()) {

          bool foundExpr = false;


          for (auto reassocationIndices :

               llvm::enumerate(expandShapeOp.getReassociationIndices())) {

            auto reassociation = reassocationIndices.value();


            AffineExpr dim = getAffineDimExpr(

                reassociation[reassociation.size() - 1], rewriter.getContext());

            if (dim == result) {

              newResults.push_back(getAffineDimExpr(reassocationIndices.index(),

                                                    rewriter.getContext()));

              foundExpr = true;

              break;

            }

          }

          if (!foundExpr)

            return failure();

        }


        auto newMap =

            AffineMap::get(sourceRank, 0, newResults, op.getContext());


        rewriter.replaceOpWithNewOp<vector::TransferReadOp>(

            op, op.getVectorType(), expandShapeOp.getViewSource(),

            sourceIndices, newMap, op.getPadding(), op.getMask(),

            op.getInBounds());

        return success();

      })

      .DefaultUnreachable("unexpected operation");

}


template <typename OpTy>

LogicalResult LoadOpOfCollapseShapeOpFolder<OpTy>::matchAndRewrite(

    OpTy loadOp, PatternRewriter &rewriter) const {

  auto collapseShapeOp = getMemRefOperand(loadOp)

                             .template getDefiningOp<memref::CollapseShapeOp>();


  if (!collapseShapeOp)

    return failure();


  SmallVector<Value> sourceIndices;

  resolveSourceIndicesCollapseShape(loadOp.getLoc(), rewriter, collapseShapeOp,

                                    loadOp.getIndices(), sourceIndices);

  llvm::TypeSwitch<Operation *, void>(loadOp)

      .Case([&](memref::LoadOp op) {

        rewriter.replaceOpWithNewOp<memref::LoadOp>(

            loadOp, collapseShapeOp.getViewSource(), sourceIndices,

            op.getNontemporal());

      })

      .Case([&](vector::LoadOp op) {

        rewriter.replaceOpWithNewOp<vector::LoadOp>(

            op, op.getType(), collapseShapeOp.getViewSource(), sourceIndices,

            op.getNontemporal());

      })

      .Case([&](vector::MaskedLoadOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedLoadOp>(

            op, op.getType(), collapseShapeOp.getViewSource(), sourceIndices,

            op.getMask(), op.getPassThru());

      })

      .DefaultUnreachable("unexpected operation");

  return success();

}


template <typename OpTy>

LogicalResult StoreOpOfSubViewOpFolder<OpTy>::matchAndRewrite(

    OpTy storeOp, PatternRewriter &rewriter) const {

  auto subViewOp =

      getMemRefOperand(storeOp).template getDefiningOp<memref::SubViewOp>();


  if (!subViewOp)

    return rewriter.notifyMatchFailure(storeOp, "not a subview producer");


  LogicalResult preconditionResult =

      preconditionsFoldSubViewOp(rewriter, storeOp, subViewOp);

  if (failed(preconditionResult))

    return preconditionResult;


  SmallVector<Value> sourceIndices;

  affine::resolveIndicesIntoOpWithOffsetsAndStrides(

      rewriter, storeOp.getLoc(), subViewOp.getMixedOffsets(),

      subViewOp.getMixedStrides(), subViewOp.getDroppedDims(),

      storeOp.getIndices(), sourceIndices);


  llvm::TypeSwitch<Operation *, void>(storeOp)

      .Case([&](memref::StoreOp op) {

        rewriter.replaceOpWithNewOp<memref::StoreOp>(

            op, op.getValue(), subViewOp.getSource(), sourceIndices,

            op.getNontemporal());

      })

      .Case([&](vector::TransferWriteOp op) {

        rewriter.replaceOpWithNewOp<vector::TransferWriteOp>(

            op, op.getValue(), subViewOp.getSource(), sourceIndices,

            AffineMapAttr::get(expandDimsToRank(

                op.getPermutationMap(), subViewOp.getSourceType().getRank(),

                subViewOp.getDroppedDims())),

            op.getMask(), op.getInBoundsAttr());

      })

      .Case([&](vector::StoreOp op) {

        rewriter.replaceOpWithNewOp<vector::StoreOp>(

            op, op.getValueToStore(), subViewOp.getSource(), sourceIndices);

      })

      .Case([&](vector::MaskedStoreOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedStoreOp>(

            op, subViewOp.getSource(), sourceIndices, op.getMask(),

            op.getValueToStore());

      })

      .Case([&](gpu::SubgroupMmaStoreMatrixOp op) {

        rewriter.replaceOpWithNewOp<gpu::SubgroupMmaStoreMatrixOp>(

            op, op.getSrc(), subViewOp.getSource(), sourceIndices,

            op.getLeadDimension(), op.getTransposeAttr());

      })

      .DefaultUnreachable("unexpected operation");

  return success();

}


template <typename OpTy>

LogicalResult StoreOpOfExpandShapeOpFolder<OpTy>::matchAndRewrite(

    OpTy storeOp, PatternRewriter &rewriter) const {

  auto expandShapeOp =

      getMemRefOperand(storeOp).template getDefiningOp<memref::ExpandShapeOp>();


  if (!expandShapeOp)

    return failure();


  SmallVector<Value> sourceIndices;

  // memref.store guarantees that indexes start inbounds while the vector

  // operations don't. This impacts if our linearization is `disjoint`

  resolveSourceIndicesExpandShape(storeOp.getLoc(), rewriter, expandShapeOp,

                                  storeOp.getIndices(), sourceIndices,

                                  isa<memref::StoreOp>(storeOp.getOperation()));

  llvm::TypeSwitch<Operation *, void>(storeOp)

      .Case([&](memref::StoreOp op) {

        rewriter.replaceOpWithNewOp<memref::StoreOp>(

            storeOp, op.getValueToStore(), expandShapeOp.getViewSource(),

            sourceIndices, op.getNontemporal());

      })

      .Case([&](vector::StoreOp op) {

        rewriter.replaceOpWithNewOp<vector::StoreOp>(

            op, op.getValueToStore(), expandShapeOp.getViewSource(),

            sourceIndices, op.getNontemporal());

      })

      .Case([&](vector::MaskedStoreOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedStoreOp>(

            op, expandShapeOp.getViewSource(), sourceIndices, op.getMask(),

            op.getValueToStore());

      })

      .DefaultUnreachable("unexpected operation");

  return success();

}


template <typename OpTy>

LogicalResult StoreOpOfCollapseShapeOpFolder<OpTy>::matchAndRewrite(

    OpTy storeOp, PatternRewriter &rewriter) const {

  auto collapseShapeOp = getMemRefOperand(storeOp)

                             .template getDefiningOp<memref::CollapseShapeOp>();


  if (!collapseShapeOp)

    return failure();


  SmallVector<Value> sourceIndices;

  resolveSourceIndicesCollapseShape(storeOp.getLoc(), rewriter, collapseShapeOp,

                                    storeOp.getIndices(), sourceIndices);

  llvm::TypeSwitch<Operation *, void>(storeOp)

      .Case([&](memref::StoreOp op) {

        rewriter.replaceOpWithNewOp<memref::StoreOp>(

            storeOp, op.getValueToStore(), collapseShapeOp.getViewSource(),

            sourceIndices, op.getNontemporal());

      })

      .Case([&](vector::StoreOp op) {

        rewriter.replaceOpWithNewOp<vector::StoreOp>(

            op, op.getValueToStore(), collapseShapeOp.getViewSource(),

            sourceIndices, op.getNontemporal());

      })

      .Case([&](vector::MaskedStoreOp op) {

        rewriter.replaceOpWithNewOp<vector::MaskedStoreOp>(

            op, collapseShapeOp.getViewSource(), sourceIndices, op.getMask(),

            op.getValueToStore());

      })

      .DefaultUnreachable("unexpected operation");

  return success();

}


LogicalResult NVGPUAsyncCopyOpSubViewOpFolder::matchAndRewrite(

    nvgpu::DeviceAsyncCopyOp copyOp, PatternRewriter &rewriter) const {


  LLVM_DEBUG(DBGS() << "copyOp       : " << copyOp << "\n");


  auto srcSubViewOp =

      copyOp.getSrc().template getDefiningOp<memref::SubViewOp>();

  auto dstSubViewOp =

      copyOp.getDst().template getDefiningOp<memref::SubViewOp>();


  if (!(srcSubViewOp || dstSubViewOp))

    return rewriter.notifyMatchFailure(copyOp, "does not use subview ops for "

                                               "source or destination");


  // If the source is a subview, we need to resolve the indices.

  SmallVector<Value> foldedSrcIndices(copyOp.getSrcIndices().begin(),

                                      copyOp.getSrcIndices().end());


  if (srcSubViewOp) {

    LLVM_DEBUG(DBGS() << "srcSubViewOp : " << srcSubViewOp << "\n");

    affine::resolveIndicesIntoOpWithOffsetsAndStrides(

        rewriter, copyOp.getLoc(), srcSubViewOp.getMixedOffsets(),

        srcSubViewOp.getMixedStrides(), srcSubViewOp.getDroppedDims(),

        copyOp.getSrcIndices(), foldedSrcIndices);

  }


  // If the destination is a subview, we need to resolve the indices.

  SmallVector<Value> foldedDstIndices(copyOp.getDstIndices().begin(),

                                      copyOp.getDstIndices().end());


  if (dstSubViewOp) {

    LLVM_DEBUG(DBGS() << "dstSubViewOp : " << dstSubViewOp << "\n");

    affine::resolveIndicesIntoOpWithOffsetsAndStrides(

        rewriter, copyOp.getLoc(), dstSubViewOp.getMixedOffsets(),

        dstSubViewOp.getMixedStrides(), dstSubViewOp.getDroppedDims(),

        copyOp.getDstIndices(), foldedDstIndices);

  }


  // Replace the copy op with a new copy op that uses the source and destination

  // of the subview.

  rewriter.replaceOpWithNewOp<nvgpu::DeviceAsyncCopyOp>(

      copyOp, nvgpu::DeviceAsyncTokenType::get(copyOp.getContext()),

      (dstSubViewOp ? dstSubViewOp.getSource() : copyOp.getDst()),

      foldedDstIndices,

      (srcSubViewOp ? srcSubViewOp.getSource() : copyOp.getSrc()),

      foldedSrcIndices, copyOp.getDstElements(), copyOp.getSrcElements(),

      copyOp.getBypassL1Attr());


  return success();

}


void memref::populateFoldMemRefAliasOpPatterns(RewritePatternSet &patterns) {

  patterns.add<LoadOpOfSubViewOpFolder<memref::LoadOp>,

               LoadOpOfSubViewOpFolder<nvgpu::LdMatrixOp>,

               LoadOpOfSubViewOpFolder<vector::LoadOp>,

               LoadOpOfSubViewOpFolder<vector::MaskedLoadOp>,

               LoadOpOfSubViewOpFolder<vector::TransferReadOp>,

               LoadOpOfSubViewOpFolder<gpu::SubgroupMmaLoadMatrixOp>,

               StoreOpOfSubViewOpFolder<memref::StoreOp>,

               StoreOpOfSubViewOpFolder<vector::TransferWriteOp>,

               StoreOpOfSubViewOpFolder<vector::StoreOp>,

               StoreOpOfSubViewOpFolder<vector::MaskedStoreOp>,

               StoreOpOfSubViewOpFolder<gpu::SubgroupMmaStoreMatrixOp>,

               LoadOpOfExpandShapeOpFolder<memref::LoadOp>,

               LoadOpOfExpandShapeOpFolder<vector::LoadOp>,

               LoadOpOfExpandShapeOpFolder<vector::MaskedLoadOp>,

               LoadOpOfExpandShapeOpFolder<vector::TransferReadOp>,

               StoreOpOfExpandShapeOpFolder<memref::StoreOp>,

               StoreOpOfExpandShapeOpFolder<vector::StoreOp>,

               StoreOpOfExpandShapeOpFolder<vector::MaskedStoreOp>,

               LoadOpOfCollapseShapeOpFolder<memref::LoadOp>,

               LoadOpOfCollapseShapeOpFolder<vector::LoadOp>,

               LoadOpOfCollapseShapeOpFolder<vector::MaskedLoadOp>,

               StoreOpOfCollapseShapeOpFolder<memref::StoreOp>,

               StoreOpOfCollapseShapeOpFolder<vector::StoreOp>,

               StoreOpOfCollapseShapeOpFolder<vector::MaskedStoreOp>,

               SubViewOfSubViewFolder, NVGPUAsyncCopyOpSubViewOpFolder>(

      patterns.getContext());

}


//===----------------------------------------------------------------------===//

// Pass registration

//===----------------------------------------------------------------------===//


namespace {


struct FoldMemRefAliasOpsPass final

    : public memref::impl::FoldMemRefAliasOpsPassBase<FoldMemRefAliasOpsPass> {

  void runOnOperation() override;

};


} // namespace


void FoldMemRefAliasOpsPass::runOnOperation() {

  RewritePatternSet patterns(&getContext());

  memref::populateFoldMemRefAliasOpPatterns(patterns);

  (void)applyPatternsGreedily(getOperation(), std::move(patterns));

}

success
return success()

Passes.h

MemRefUtils.h

GPUDialect.h

GreedyPatternRewriteDriver.h

DBGS
#define DBGS()
Definition Hoisting.cpp:32

result
result
Definition LinalgTransformOps.cpp:2120

getContext
b getContext())

preconditionsFoldSubViewOp
static LogicalResult preconditionsFoldSubViewOp(RewriterBase &rewriter, Operation *op, memref::SubViewOp subviewOp)
Definition FoldMemRefAliasOps.cpp:216

preconditionsFoldSubViewOpImpl
static LogicalResult preconditionsFoldSubViewOpImpl(RewriterBase &rewriter, XferOp xferOp, memref::SubViewOp subviewOp)
Definition FoldMemRefAliasOps.cpp:202

getMemRefOperand
static Value getMemRefOperand(LoadOrStoreOpTy op)
Helpers to access the memref operand for each op.
Definition FoldMemRefAliasOps.cpp:48

NVGPUDialect.h

VectorOps.h

ViewLikeInterfaceUtils.h

int64_t

llvm::SmallVector
Definition LLVM.h:64

llvm::TypeSwitch
Definition LLVM.h:74

mlir::AffineExpr
Base type for affine expression.
Definition AffineExpr.h:68

mlir::AffineMap::get
static AffineMap get(MLIRContext *context)
Returns a zero result affine map with no dimensions or symbols: () -> ().
Definition MLIRContext.cpp:1224

mlir::Builder::getContext
MLIRContext * getContext() const
Definition Builders.h:56

mlir::Operation
Operation is the basic unit of execution within MLIR.
Definition Operation.h:88

mlir::PatternRewriter
A special type of RewriterBase that coordinates the application of a rewrite pattern on the current I...
Definition PatternMatch.h:799

mlir::RewritePatternSet
Definition PatternMatch.h:822

mlir::RewritePatternSet::getContext
MLIRContext * getContext() const
Definition PatternMatch.h:837

mlir::RewritePatternSet::add
RewritePatternSet & add(ConstructorArg &&arg, ConstructorArgs &&...args)
Add an instance of each of the pattern types 'Ts' to the pattern list with the given arguments.
Definition PatternMatch.h:861

mlir::RewriterBase
This class coordinates the application of a rewrite on a set of IR, providing a way for clients to tr...
Definition PatternMatch.h:368

mlir::RewriterBase::notifyMatchFailure
std::enable_if_t<!std::is_convertible< CallbackT, Twine >::value, LogicalResult > notifyMatchFailure(Location loc, CallbackT &&reasonCallback)
Used to notify the listener that the IR failed to be rewritten because of a match failure,...
Definition PatternMatch.h:732

mlir::RewriterBase::replaceOpWithNewOp
OpTy replaceOpWithNewOp(Operation *op, Args &&...args)
Replace the results of the given (original) op with a new op that is created without verification (re...
Definition PatternMatch.h:529

mlir::Value
This class represents an instance of an SSA value in the MLIR system, representing a computable value...
Definition Value.h:96

Utils.h

MemRef.h

Transforms.h

AffineMap.h

mlir::affine::resolveIndicesIntoOpWithOffsetsAndStrides
void resolveIndicesIntoOpWithOffsetsAndStrides(RewriterBase &rewriter, Location loc, ArrayRef< OpFoldResult > mixedSourceOffsets, ArrayRef< OpFoldResult > mixedSourceStrides, const llvm::SmallBitVector &rankReducedDims, ArrayRef< OpFoldResult > consumerIndices, SmallVectorImpl< Value > &resolvedIndices)
Given the 'consumerIndices' of a load/store operation operating on an op with offsets and strides,...
Definition ViewLikeInterfaceUtils.cpp:80

mlir::memref
Definition Passes.h:27

mlir::memref::populateFoldMemRefAliasOpPatterns
void populateFoldMemRefAliasOpPatterns(RewritePatternSet &patterns)
Appends patterns for folding memref aliasing ops into consumer load/store ops into patterns.
Definition FoldMemRefAliasOps.cpp:570

mlir::memref::resolveSourceIndicesCollapseShape
void resolveSourceIndicesCollapseShape(Location loc, PatternRewriter &rewriter, memref::CollapseShapeOp collapseShapeOp, ValueRange indices, SmallVectorImpl< Value > &sourceIndices)
Given the 'indices' of a load/store operation where the memref is a result of a collapse_shape op,...
Definition MemRefUtils.cpp:252

mlir::memref::resolveSourceIndicesExpandShape
void resolveSourceIndicesExpandShape(Location loc, PatternRewriter &rewriter, memref::ExpandShapeOp expandShapeOp, ValueRange indices, SmallVectorImpl< Value > &sourceIndices, bool startsInbounds)
Given the 'indices' of a load/store operation where the memref is a result of a expand_shape op,...
Definition MemRefUtils.cpp:226

mlir::remark::failed
detail::InFlightRemark failed(Location loc, RemarkOpts opts)
Report an optimization remark that failed.
Definition Remarks.h:717

mlir
Include the generated interface declarations.
Definition AliasAnalysis.h:19

mlir::expandDimsToRank
AffineMap expandDimsToRank(AffineMap map, int64_t rank, const llvm::SmallBitVector &projectedDimensions)
Expand map to operate on rank dims while projecting out the dims in projectedDimensions.
Definition AffineMap.cpp:948

mlir::applyPatternsGreedily
LogicalResult applyPatternsGreedily(Region &region, const FrozenRewritePatternSet &patterns, GreedyRewriteConfig config=GreedyRewriteConfig(), bool *changed=nullptr)
Rewrite ops in the given region, which must be isolated from above, by repeatedly applying the highes...
Definition GreedyPatternRewriteDriver.cpp:912

mlir::getAsOpFoldResult
OpFoldResult getAsOpFoldResult(Value val)
Given a value, try to extract a constant Attribute.
Definition StaticValueUtils.cpp:95

mlir::getAffineDimExpr
AffineExpr getAffineDimExpr(unsigned position, MLIRContext *context)
These free functions allow clients of the API to not use classes in detail.

mlir::OpRewritePattern
OpRewritePattern is a wrapper around RewritePattern that allows for matching and rewriting against an...
Definition PatternMatch.h:314