IR: Implement VectorZeroExtend

2018-02-10 10:28:38 +00:00 · 2018-02-10 10:28:38 +00:00 · 59ace60b03
commit 59ace60b03
parent d3a4e1efe2
4 changed files with 61 additions and 0 deletions
--- a/src/backend_x64/emit_x64_vector.cpp
+++ b/src/backend_x64/emit_x64_vector.cpp
@ -634,6 +634,47 @@ void EmitX64::EmitVectorLogicalShiftLeft64(EmitContext& ctx, IR::Inst* inst) {
    ctx.reg_alloc.DefineValue(inst, result);
 }

+static void EmitVectorZeroExtend(BlockOfCode& code, EmitContext& ctx, IR::Inst* inst, int size) {
+    auto args = ctx.reg_alloc.GetArgumentInfo(inst);
+
+    const Xbyak::Xmm a = ctx.reg_alloc.UseScratchXmm(args[0]);
+    const Xbyak::Xmm zeros = ctx.reg_alloc.ScratchXmm();
+
+    code.pxor(zeros, zeros);
+    switch (size) {
+    case 8:
+        code.punpcklbw(a, zeros);
+        break;
+    case 16:
+        code.punpcklwd(a, zeros);
+        break;
+    case 32:
+        code.punpckldq(a, zeros);
+        break;
+    case 64:
+        code.punpcklqdq(a, zeros);
+        break;
+    }
+
+    ctx.reg_alloc.DefineValue(inst, a);
+}
+
+void EmitX64::EmitVectorZeroExtend8(EmitContext& ctx, IR::Inst* inst) {
+    EmitVectorZeroExtend(code, ctx, inst, 8);
+}
+
+void EmitX64::EmitVectorZeroExtend16(EmitContext& ctx, IR::Inst* inst) {
+    EmitVectorZeroExtend(code, ctx, inst, 16);
+}
+
+void EmitX64::EmitVectorZeroExtend32(EmitContext& ctx, IR::Inst* inst) {
+    EmitVectorZeroExtend(code, ctx, inst, 32);
+}
+
+void EmitX64::EmitVectorZeroExtend64(EmitContext& ctx, IR::Inst* inst) {
+    EmitVectorZeroExtend(code, ctx, inst, 64);
+}
+
 void EmitX64::EmitVectorZeroUpper(EmitContext& ctx, IR::Inst* inst) {
    auto args = ctx.reg_alloc.GetArgumentInfo(inst);

--- a/src/frontend/ir/ir_emitter.cpp
+++ b/src/frontend/ir/ir_emitter.cpp
@ -919,6 +919,21 @@ U128 IREmitter::VectorPairedAdd(size_t esize, const U128& a, const U128& b) {
    return {};
 }

+U128 IREmitter::VectorZeroExtend(size_t original_esize, const U128& a) {
+    switch (original_esize) {
+    case 8:
+        return Inst<U128>(Opcode::VectorZeroExtend8, a);
+    case 16:
+        return Inst<U128>(Opcode::VectorZeroExtend16, a);
+    case 32:
+        return Inst<U128>(Opcode::VectorZeroExtend32, a);
+    case 64:
+        return Inst<U128>(Opcode::VectorZeroExtend64, a);
+    }
+    UNREACHABLE();
+    return {};
+}
+
 U128 IREmitter::VectorZeroUpper(const U128& a) {
    return Inst<U128>(Opcode::VectorZeroUpper, a);
 }
--- a/src/frontend/ir/ir_emitter.h
+++ b/src/frontend/ir/ir_emitter.h
@ -219,6 +219,7 @@ public:
    U128 VectorOr(const U128& a, const U128& b);
    U128 VectorPairedAdd(size_t esize, const U128& a, const U128& b);
    U128 VectorPairedAddLower(size_t esize, const U128& a, const U128& b);
+    U128 VectorZeroExtend(size_t original_esize, const U128& a);
    U128 VectorZeroUpper(const U128& a);

    U32U64 FPAbs(const U32U64& a);
--- a/src/frontend/ir/opcodes.inc
+++ b/src/frontend/ir/opcodes.inc
@ -233,6 +233,10 @@ OPCODE(VectorPairedAdd8,            T::U128,        T::U128,        T::U128
 OPCODE(VectorPairedAdd16,           T::U128,        T::U128,        T::U128                         )
 OPCODE(VectorPairedAdd32,           T::U128,        T::U128,        T::U128                         )
 OPCODE(VectorPairedAdd64,           T::U128,        T::U128,        T::U128                         )
+OPCODE(VectorZeroExtend8,           T::U128,        T::U128                                         )
+OPCODE(VectorZeroExtend16,          T::U128,        T::U128                                         )
+OPCODE(VectorZeroExtend32,          T::U128,        T::U128                                         )
+OPCODE(VectorZeroExtend64,          T::U128,        T::U128                                         )
 OPCODE(VectorZeroUpper,             T::U128,        T::U128                                         )

 // Floating-point operations