doxygen/ArmSVE_2Transforms_2LegalizeForLLVMExport_8cpp_source.html

 //===- LegalizeForLLVMExport.cpp - Prepare ArmSVE for LLVM translation ----===//

 //

 // Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

 // See https://llvm.org/LICENSE.txt for license information.

 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

 //

 //===----------------------------------------------------------------------===//


 #include "mlir/Conversion/LLVMCommon/ConversionTarget.h"

 #include "mlir/Conversion/LLVMCommon/Pattern.h"

 #include "mlir/Dialect/ArmSVE/IR/ArmSVEDialect.h"

 #include "mlir/Dialect/ArmSVE/Transforms/Transforms.h"

 #include "mlir/Dialect/Func/IR/FuncOps.h"

 #include "mlir/Dialect/LLVMIR/LLVMDialect.h"

 #include "mlir/Dialect/Utils/IndexingUtils.h"

 #include "mlir/Dialect/Vector/IR/VectorOps.h"

 #include "mlir/IR/BuiltinOps.h"

 #include "mlir/IR/PatternMatch.h"


 using namespace mlir;

 using namespace mlir::arm_sve;


 using SdotOpLowering = OneToOneConvertToLLVMPattern<SdotOp, SdotIntrOp>;

 using SmmlaOpLowering = OneToOneConvertToLLVMPattern<SmmlaOp, SmmlaIntrOp>;

 using UdotOpLowering = OneToOneConvertToLLVMPattern<UdotOp, UdotIntrOp>;

 using UmmlaOpLowering = OneToOneConvertToLLVMPattern<UmmlaOp, UmmlaIntrOp>;

 using UsmmlaOpLowering = OneToOneConvertToLLVMPattern<UsmmlaOp, UsmmlaIntrOp>;

 using DupQLaneLowering =

     OneToOneConvertToLLVMPattern<DupQLaneOp, DupQLaneIntrOp>;

 using ScalableMaskedAddIOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedAddIOp,

                                  ScalableMaskedAddIIntrOp>;

 using ScalableMaskedAddFOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedAddFOp,

                                  ScalableMaskedAddFIntrOp>;

 using ScalableMaskedSubIOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedSubIOp,

                                  ScalableMaskedSubIIntrOp>;

 using ScalableMaskedSubFOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedSubFOp,

                                  ScalableMaskedSubFIntrOp>;

 using ScalableMaskedMulIOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedMulIOp,

                                  ScalableMaskedMulIIntrOp>;

 using ScalableMaskedMulFOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedMulFOp,

                                  ScalableMaskedMulFIntrOp>;

 using ScalableMaskedSDivIOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedSDivIOp,

                                  ScalableMaskedSDivIIntrOp>;

 using ScalableMaskedUDivIOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedUDivIOp,

                                  ScalableMaskedUDivIIntrOp>;

 using ScalableMaskedDivFOpLowering =

     OneToOneConvertToLLVMPattern<ScalableMaskedDivFOp,

                                  ScalableMaskedDivFIntrOp>;


 namespace {


 /// Unrolls a conversion to/from equivalent vector types, to allow using a

 /// conversion intrinsic that only supports 1-D vector types.

 ///

 /// Example:

 /// ```

 /// %result = arm_sve.convert_to_svbool %source : vector<2x[4]xi1>

 /// ```

 /// is rewritten into:

 /// ```

 /// %cst = arith.constant dense<false> : vector<2x[16]xi1>

 /// %1 = vector.extract %source[0] : vector<[4]xi1> from vector<2x[4]xi1>

 /// %2 = "arm_sve.intr.convert.to.svbool"(%1)

 ///                : (vector<[4]xi1>) -> vector<[16]xi1>

 /// %3 = vector.insert %2, %cst[0] : vector<[16]xi1> into vector<2x[16]xi1>

 /// %4 = vector.extract %source[1] : vector<[4]xi1> from vector<2x[4]xi1>

 /// %5 = "arm_sve.intr.convert.to.svbool"(%4)

 ///                : (vector<[4]xi1>) -> vector<[16]xi1>

 /// %result = vector.insert %5, %3[1] : vector<[16]xi1> into vector<2x[16]xi1>

 /// ```

 template <typename Op, typename IntrOp>

 struct SvboolConversionOpLowering : public ConvertOpToLLVMPattern<Op> {

   using ConvertOpToLLVMPattern<Op>::ConvertOpToLLVMPattern;


   LogicalResult

   matchAndRewrite(Op convertOp, typename Op::Adaptor,

                   ConversionPatternRewriter &rewriter) const override {

     auto loc = convertOp.getLoc();


     auto source = convertOp.getSource();

     VectorType sourceType = source.getType();

     VectorType resultType = convertOp.getResult().getType();


     Value result = rewriter.create<arith::ConstantOp>(

         loc, resultType, rewriter.getZeroAttr(resultType));


     // We want to iterate over the input vector in steps of the trailing

     // dimension. So this creates tile shape where all leading dimensions are 1,

     // and the trailing dimension step is the size of the dimension.

     SmallVector<int64_t> tileShape(sourceType.getRank(), 1);

     tileShape.back() = sourceType.getShape().back();


     // Iterate over all scalable mask/predicate slices of the source vector.

     for (SmallVector<int64_t> index :

          StaticTileOffsetRange(sourceType.getShape(), tileShape)) {

       auto extractOrInsertPosition = ArrayRef(index).drop_back();

       auto sourceVector = rewriter.create<vector::ExtractOp>(

           loc, source, extractOrInsertPosition);

       VectorType convertedType =

           VectorType::Builder(llvm::cast<VectorType>(sourceVector.getType()))

               .setDim(0, resultType.getShape().back());

       auto convertedVector =

           rewriter.create<IntrOp>(loc, TypeRange{convertedType}, sourceVector);

       result = rewriter.create<vector::InsertOp>(loc, convertedVector, result,

                                                  extractOrInsertPosition);

     }


     rewriter.replaceOp(convertOp, result);

     return success();

   }

 };


 using ConvertToSvboolOpLowering =

     SvboolConversionOpLowering<ConvertToSvboolOp, ConvertToSvboolIntrOp>;


 using ConvertFromSvboolOpLowering =

     SvboolConversionOpLowering<ConvertFromSvboolOp, ConvertFromSvboolIntrOp>;


 using ZipX2OpLowering = OneToOneConvertToLLVMPattern<ZipX2Op, ZipX2IntrOp>;

 using ZipX4OpLowering = OneToOneConvertToLLVMPattern<ZipX4Op, ZipX4IntrOp>;


 /// Lower `arm_sve.psel` to LLVM intrinsics. This is almost a 1-to-1 conversion

 /// but first input (P1) and result predicates need conversion to/from svbool.

 struct PselOpLowering : public ConvertOpToLLVMPattern<PselOp> {

   using ConvertOpToLLVMPattern::ConvertOpToLLVMPattern;


   LogicalResult

   matchAndRewrite(PselOp pselOp, PselOp::Adaptor adaptor,

                   ConversionPatternRewriter &rewriter) const override {

     auto svboolType = VectorType::get(16, rewriter.getI1Type(), true);

     auto loc = pselOp.getLoc();

     auto svboolP1 = rewriter.create<ConvertToSvboolIntrOp>(loc, svboolType,

                                                            adaptor.getP1());

     auto indexI32 = rewriter.create<arith::IndexCastOp>(

         loc, rewriter.getI32Type(), pselOp.getIndex());

     auto pselIntr = rewriter.create<PselIntrOp>(loc, svboolType, svboolP1,

                                                 pselOp.getP2(), indexI32);

     rewriter.replaceOpWithNewOp<ConvertFromSvboolIntrOp>(

         pselOp, adaptor.getP1().getType(), pselIntr);

     return success();

   }

 };


 /// Converts `vector.create_mask` ops that match the size of an SVE predicate

 /// to the `whilelt` intrinsic. This produces more canonical codegen than the

 /// generic LLVM lowering, see https://github.com/llvm/llvm-project/issues/81840

 /// for more details. Note that we can't use (the more general) active.lane.mask

 /// as its semantics don't neatly map on to `vector.create_mask`, as it does an

 /// unsigned comparison (whereas `create_mask` is signed), and is UB/posion if

 /// `n` is zero (whereas `create_mask` just returns an all-false mask).

 struct CreateMaskOpLowering

     : public ConvertOpToLLVMPattern<vector::CreateMaskOp> {

   using ConvertOpToLLVMPattern::ConvertOpToLLVMPattern;


   LogicalResult

   matchAndRewrite(vector::CreateMaskOp createMaskOp,

                   vector::CreateMaskOp::Adaptor adaptor,

                   ConversionPatternRewriter &rewriter) const override {

     auto maskType = createMaskOp.getVectorType();

     if (maskType.getRank() != 1 || !maskType.isScalable())

       return rewriter.notifyMatchFailure(createMaskOp, "not 1-D and scalable");


     // TODO: Support masks which are multiples of SVE predicates.

     auto maskBaseSize = maskType.getDimSize(0);

     if (maskBaseSize < 2 || maskBaseSize > 16 ||

         !llvm::isPowerOf2_32(uint32_t(maskBaseSize)))

       return rewriter.notifyMatchFailure(createMaskOp,

                                          "not SVE predicate-sized");


     auto loc = createMaskOp.getLoc();

     auto zero = rewriter.create<LLVM::ZeroOp>(loc, rewriter.getI64Type());

     rewriter.replaceOpWithNewOp<WhileLTIntrOp>(createMaskOp, maskType, zero,

                                                adaptor.getOperands()[0]);

     return success();

   }

 };


 } // namespace


 /// Populate the given list with patterns that convert from ArmSVE to LLVM.

 void mlir::populateArmSVELegalizeForLLVMExportPatterns(

     const LLVMTypeConverter &converter, RewritePatternSet &patterns) {

   // Populate conversion patterns


   // clang-format off

   patterns.add<ConvertFromSvboolOpLowering,

                ConvertToSvboolOpLowering,

                DupQLaneLowering,

                PselOpLowering,

                ScalableMaskedAddFOpLowering,

                ScalableMaskedAddIOpLowering,

                ScalableMaskedDivFOpLowering,

                ScalableMaskedMulFOpLowering,

                ScalableMaskedMulIOpLowering,

                ScalableMaskedSDivIOpLowering,

                ScalableMaskedSubFOpLowering,

                ScalableMaskedSubIOpLowering,

                ScalableMaskedUDivIOpLowering,

                SmmlaOpLowering,

                UdotOpLowering,

                UmmlaOpLowering,

                UsmmlaOpLowering,

                ZipX2OpLowering,

                ZipX4OpLowering,

                SdotOpLowering>(converter);

   // Add vector.create_mask conversion with a high benefit as it produces much

   // nicer code than the generic lowering.

   patterns.add<CreateMaskOpLowering>(converter, /*benefit=*/4096);

   // clang-format on

 }


 void mlir::configureArmSVELegalizeForExportTarget(

     LLVMConversionTarget &target) {

   // clang-format off

   target.addLegalOp<BfmmlaOp,

                     ConvertFromSvboolIntrOp,

                     ConvertToSvboolIntrOp,

                     DupQLaneIntrOp,

                     PselIntrOp,

                     ScalableMaskedAddFIntrOp,

                     ScalableMaskedAddIIntrOp,

                     ScalableMaskedDivFIntrOp,

                     ScalableMaskedMulFIntrOp,

                     ScalableMaskedMulIIntrOp,

                     ScalableMaskedSDivIIntrOp,

                     ScalableMaskedSubFIntrOp,

                     ScalableMaskedSubIIntrOp,

                     ScalableMaskedUDivIIntrOp,

                     SmmlaIntrOp,

                     UdotIntrOp,

                     UmmlaIntrOp,

                     UsmmlaIntrOp,

                     WhileLTIntrOp,

                     ZipX2IntrOp,

                     ZipX4IntrOp,

                     SdotIntrOp>();

   target.addIllegalOp<ConvertFromSvboolOp,

                       ConvertToSvboolOp,

                       DupQLaneOp,

                       PselOp,

                       ScalableMaskedAddFOp,

                       ScalableMaskedAddIOp,

                       ScalableMaskedDivFOp,

                       ScalableMaskedMulFOp,

                       ScalableMaskedMulIOp,

                       ScalableMaskedSDivIOp,

                       ScalableMaskedSubFOp,

                       ScalableMaskedSubIOp,

                       ScalableMaskedUDivIOp,

                       SmmlaOp,

                       UdotOp,

                       UmmlaOp,

                       UsmmlaOp,

                       ZipX2Op,

                       ZipX4Op,

                       SdotOp>();

   // clang-format on

 }

ArmSVEDialect.h

UmmlaOpLowering
OneToOneConvertToLLVMPattern< UmmlaOp, UmmlaIntrOp > UmmlaOpLowering
Definition: LegalizeForLLVMExport.cpp:26

ScalableMaskedSubIOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedSubIOp, ScalableMaskedSubIIntrOp > ScalableMaskedSubIOpLowering
Definition: LegalizeForLLVMExport.cpp:38

ScalableMaskedSDivIOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedSDivIOp, ScalableMaskedSDivIIntrOp > ScalableMaskedSDivIOpLowering
Definition: LegalizeForLLVMExport.cpp:50

ScalableMaskedAddIOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedAddIOp, ScalableMaskedAddIIntrOp > ScalableMaskedAddIOpLowering
Definition: LegalizeForLLVMExport.cpp:32

UsmmlaOpLowering
OneToOneConvertToLLVMPattern< UsmmlaOp, UsmmlaIntrOp > UsmmlaOpLowering
Definition: LegalizeForLLVMExport.cpp:27

SmmlaOpLowering
OneToOneConvertToLLVMPattern< SmmlaOp, SmmlaIntrOp > SmmlaOpLowering
Definition: LegalizeForLLVMExport.cpp:24

ScalableMaskedSubFOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedSubFOp, ScalableMaskedSubFIntrOp > ScalableMaskedSubFOpLowering
Definition: LegalizeForLLVMExport.cpp:41

ScalableMaskedUDivIOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedUDivIOp, ScalableMaskedUDivIIntrOp > ScalableMaskedUDivIOpLowering
Definition: LegalizeForLLVMExport.cpp:53

ScalableMaskedDivFOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedDivFOp, ScalableMaskedDivFIntrOp > ScalableMaskedDivFOpLowering
Definition: LegalizeForLLVMExport.cpp:56

ScalableMaskedMulFOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedMulFOp, ScalableMaskedMulFIntrOp > ScalableMaskedMulFOpLowering
Definition: LegalizeForLLVMExport.cpp:47

UdotOpLowering
OneToOneConvertToLLVMPattern< UdotOp, UdotIntrOp > UdotOpLowering
Definition: LegalizeForLLVMExport.cpp:25

ScalableMaskedAddFOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedAddFOp, ScalableMaskedAddFIntrOp > ScalableMaskedAddFOpLowering
Definition: LegalizeForLLVMExport.cpp:35

DupQLaneLowering
OneToOneConvertToLLVMPattern< DupQLaneOp, DupQLaneIntrOp > DupQLaneLowering
Definition: LegalizeForLLVMExport.cpp:29

ScalableMaskedMulIOpLowering
OneToOneConvertToLLVMPattern< ScalableMaskedMulIOp, ScalableMaskedMulIIntrOp > ScalableMaskedMulIOpLowering
Definition: LegalizeForLLVMExport.cpp:44

BuiltinOps.h

ConversionTarget.h

FuncOps.h

IndexingUtils.h

LLVMDialect.h

PatternMatch.h

VectorOps.h

llvm::ArrayRef
Definition: LLVM.h:48

llvm::SmallVector
Definition: LLVM.h:72

mlir::Builder::getI64Type
IntegerType getI64Type()
Definition: Builders.cpp:64

mlir::Builder::getI32Type
IntegerType getI32Type()
Definition: Builders.cpp:62

mlir::Builder::getZeroAttr
TypedAttr getZeroAttr(Type type)
Definition: Builders.cpp:319

mlir::Builder::getI1Type
IntegerType getI1Type()
Definition: Builders.cpp:52

mlir::ConversionPatternRewriter
This class implements a pattern rewriter for use with ConversionPatterns.
Definition: DialectConversion.h:727

mlir::ConversionPatternRewriter::replaceOp
void replaceOp(Operation *op, ValueRange newValues) override
Replace the given operation with the new values.
Definition: DialectConversion.cpp:1713

mlir::ConversionTarget::addLegalOp
void addLegalOp(OperationName op)
Register the given operations as legal.
Definition: DialectConversion.h:915

mlir::ConversionTarget::addIllegalOp
void addIllegalOp(OperationName op)
Register the given operation as illegal, i.e.
Definition: DialectConversion.h:954

mlir::ConvertOpToLLVMPattern
Utility class for operation conversions targeting the LLVM dialect that match exactly one source oper...
Definition: Pattern.h:199

mlir::ConvertOpToLLVMPattern::ConvertOpToLLVMPattern
ConvertOpToLLVMPattern(const LLVMTypeConverter &typeConverter, PatternBenefit benefit=1)
Definition: Pattern.h:205

mlir::LLVMConversionTarget
Derived class that automatically populates legalization information for different LLVM ops.
Definition: ConversionTarget.h:17

mlir::LLVMTypeConverter
Conversion from types to the LLVM IR dialect.
Definition: TypeConverter.h:35

mlir::OneToOneConvertToLLVMPattern
Generic implementation of one-to-one conversion from "SourceOp" to "TargetOp" where the latter belong...
Definition: Pattern.h:292

mlir::OpBuilder::create
Operation * create(const OperationState &state)
Creates an operation given the fields represented as an OperationState.
Definition: Builders.cpp:452

mlir::OpState::getLoc
Location getLoc()
The source location the operation was defined or derived from.
Definition: OpDefinition.h:128

mlir::Op
This provides public APIs that all operations should have.
Definition: OpDefinition.h:1672

mlir::RewritePatternSet
Definition: PatternMatch.h:771

mlir::RewriterBase::notifyMatchFailure
std::enable_if_t<!std::is_convertible< CallbackT, Twine >::value, LogicalResult > notifyMatchFailure(Location loc, CallbackT &&reasonCallback)
Used to notify the listener that the IR failed to be rewritten because of a match failure,...
Definition: PatternMatch.h:681

mlir::RewriterBase::replaceOpWithNewOp
OpTy replaceOpWithNewOp(Operation *op, Args &&...args)
Replace the results of the given (original) op with a new op that is created without verification (re...
Definition: PatternMatch.h:500

mlir::StaticTileOffsetRange
A range-style iterator that allows for iterating over the offsets of all potential tiles of size tile...
Definition: IndexingUtils.h:376

mlir::TypeRange
This class provides an abstraction over the various different ranges of value types.
Definition: TypeRange.h:37

mlir::Value
This class represents an instance of an SSA value in the MLIR system, representing a computable value...
Definition: Value.h:96

mlir::VectorType::Builder
This is a builder type that keeps local references to arguments.
Definition: BuiltinTypes.h:286

mlir::VectorType::Builder::setDim
Builder & setDim(unsigned pos, int64_t val)
Set a dim in shape @pos to val.
Definition: BuiltinTypes.h:320

Pattern.h

Transforms.h

mlir::arm_sve
Definition: ArmSVEVectorTransformOps.h:25

mlir
Include the generated interface declarations.
Definition: LocalAliasAnalysis.h:20

mlir::configureArmSVELegalizeForExportTarget
void configureArmSVELegalizeForExportTarget(LLVMConversionTarget &target)
Configure the target to support lowering ArmSVE ops to ops that map to LLVM intrinsics.
Definition: LegalizeForLLVMExport.cpp:220

mlir::patterns
const FrozenRewritePatternSet & patterns
Definition: GreedyPatternRewriteDriver.h:283

mlir::get
auto get(MLIRContext *context, Ts &&...params)
Helper method that injects context only if needed, this helps unify some of the attribute constructio...
Definition: BytecodeImplementation.h:509

mlir::populateArmSVELegalizeForLLVMExportPatterns
void populateArmSVELegalizeForLLVMExportPatterns(const LLVMTypeConverter &converter, RewritePatternSet &patterns)
Collect a set of patterns to lower ArmSVE ops to ops that map to LLVM intrinsics.
Definition: LegalizeForLLVMExport.cpp:189