@@ -128,43 +128,113 @@ define i64 @ctz_nxv8i1_no_range(<vscale x 8 x i16> %a) {
128
128
define i32 @ctz_nxv16i1 (<vscale x 16 x i1 > %pg , <vscale x 16 x i1 > %a ) {
129
129
; RV32-LABEL: ctz_nxv16i1:
130
130
; RV32: # %bb.0:
131
- ; RV32-NEXT: vmv1r.v v0, v8
131
+ ; RV32-NEXT: vsetvli a0, zero, e8, m2, ta, ma
132
+ ; RV32-NEXT: vfirst.m a0, v8
133
+ ; RV32-NEXT: bgez a0, .LBB2_2
134
+ ; RV32-NEXT: # %bb.1:
132
135
; RV32-NEXT: csrr a0, vlenb
133
136
; RV32-NEXT: slli a0, a0, 1
134
- ; RV32-NEXT: vsetvli a1, zero, e32, m8, ta, ma
135
- ; RV32-NEXT: vmv.v.x v8, a0
136
- ; RV32-NEXT: vid.v v16
137
- ; RV32-NEXT: li a1, -1
138
- ; RV32-NEXT: vmadd.vx v16, a1, v8
139
- ; RV32-NEXT: vmv.v.i v8, 0
140
- ; RV32-NEXT: vmerge.vvm v8, v8, v16, v0
141
- ; RV32-NEXT: vredmaxu.vs v8, v8, v8
142
- ; RV32-NEXT: vmv.x.s a1, v8
143
- ; RV32-NEXT: sub a0, a0, a1
137
+ ; RV32-NEXT: .LBB2_2:
144
138
; RV32-NEXT: ret
145
139
;
146
140
; RV64-LABEL: ctz_nxv16i1:
147
141
; RV64: # %bb.0:
148
- ; RV64-NEXT: vmv1r.v v0, v8
142
+ ; RV64-NEXT: vsetvli a0, zero, e8, m2, ta, ma
143
+ ; RV64-NEXT: vfirst.m a0, v8
144
+ ; RV64-NEXT: bgez a0, .LBB2_2
145
+ ; RV64-NEXT: # %bb.1:
149
146
; RV64-NEXT: csrr a0, vlenb
150
147
; RV64-NEXT: slli a0, a0, 1
151
- ; RV64-NEXT: vsetvli a1, zero, e32, m8, ta, ma
152
- ; RV64-NEXT: vmv.v.x v8, a0
153
- ; RV64-NEXT: vid.v v16
154
- ; RV64-NEXT: li a1, -1
155
- ; RV64-NEXT: vmadd.vx v16, a1, v8
156
- ; RV64-NEXT: vmv.v.i v8, 0
157
- ; RV64-NEXT: vmerge.vvm v8, v8, v16, v0
158
- ; RV64-NEXT: vredmaxu.vs v8, v8, v8
159
- ; RV64-NEXT: vmv.x.s a1, v8
160
- ; RV64-NEXT: subw a0, a0, a1
148
+ ; RV64-NEXT: .LBB2_2:
161
149
; RV64-NEXT: ret
162
150
%res = call i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 > %a , i1 0 )
163
151
ret i32 %res
164
152
}
165
153
154
+ define i32 @ctz_nxv16i1_poison (<vscale x 16 x i1 > %pg , <vscale x 16 x i1 > %a ) {
155
+ ; RV32-LABEL: ctz_nxv16i1_poison:
156
+ ; RV32: # %bb.0:
157
+ ; RV32-NEXT: vsetvli a0, zero, e8, m2, ta, ma
158
+ ; RV32-NEXT: vfirst.m a0, v8
159
+ ; RV32-NEXT: ret
160
+ ;
161
+ ; RV64-LABEL: ctz_nxv16i1_poison:
162
+ ; RV64: # %bb.0:
163
+ ; RV64-NEXT: vsetvli a0, zero, e8, m2, ta, ma
164
+ ; RV64-NEXT: vfirst.m a0, v8
165
+ ; RV64-NEXT: ret
166
+ %res = call i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 > %a , i1 1 )
167
+ ret i32 %res
168
+ }
169
+
170
+ define i32 @ctz_v16i1 (<16 x i1 > %pg , <16 x i1 > %a ) {
171
+ ; RV32-LABEL: ctz_v16i1:
172
+ ; RV32: # %bb.0:
173
+ ; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, ma
174
+ ; RV32-NEXT: vfirst.m a0, v8
175
+ ; RV32-NEXT: bgez a0, .LBB4_2
176
+ ; RV32-NEXT: # %bb.1:
177
+ ; RV32-NEXT: li a0, 16
178
+ ; RV32-NEXT: .LBB4_2:
179
+ ; RV32-NEXT: ret
180
+ ;
181
+ ; RV64-LABEL: ctz_v16i1:
182
+ ; RV64: # %bb.0:
183
+ ; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma
184
+ ; RV64-NEXT: vfirst.m a0, v8
185
+ ; RV64-NEXT: bgez a0, .LBB4_2
186
+ ; RV64-NEXT: # %bb.1:
187
+ ; RV64-NEXT: li a0, 16
188
+ ; RV64-NEXT: .LBB4_2:
189
+ ; RV64-NEXT: ret
190
+ %res = call i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 > %a , i1 0 )
191
+ ret i32 %res
192
+ }
193
+
194
+ define i32 @ctz_v16i1_poison (<16 x i1 > %pg , <16 x i1 > %a ) {
195
+ ; RV32-LABEL: ctz_v16i1_poison:
196
+ ; RV32: # %bb.0:
197
+ ; RV32-NEXT: vsetivli zero, 16, e8, m1, ta, ma
198
+ ; RV32-NEXT: vfirst.m a0, v8
199
+ ; RV32-NEXT: ret
200
+ ;
201
+ ; RV64-LABEL: ctz_v16i1_poison:
202
+ ; RV64: # %bb.0:
203
+ ; RV64-NEXT: vsetivli zero, 16, e8, m1, ta, ma
204
+ ; RV64-NEXT: vfirst.m a0, v8
205
+ ; RV64-NEXT: ret
206
+ %res = call i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 > %a , i1 1 )
207
+ ret i32 %res
208
+ }
209
+
210
+ define i16 @ctz_v8i1_i16_ret (<8 x i1 > %a ) {
211
+ ; RV32-LABEL: ctz_v8i1_i16_ret:
212
+ ; RV32: # %bb.0:
213
+ ; RV32-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
214
+ ; RV32-NEXT: vfirst.m a0, v0
215
+ ; RV32-NEXT: bgez a0, .LBB6_2
216
+ ; RV32-NEXT: # %bb.1:
217
+ ; RV32-NEXT: li a0, 8
218
+ ; RV32-NEXT: .LBB6_2:
219
+ ; RV32-NEXT: ret
220
+ ;
221
+ ; RV64-LABEL: ctz_v8i1_i16_ret:
222
+ ; RV64: # %bb.0:
223
+ ; RV64-NEXT: vsetivli zero, 8, e8, mf2, ta, ma
224
+ ; RV64-NEXT: vfirst.m a0, v0
225
+ ; RV64-NEXT: bgez a0, .LBB6_2
226
+ ; RV64-NEXT: # %bb.1:
227
+ ; RV64-NEXT: li a0, 8
228
+ ; RV64-NEXT: .LBB6_2:
229
+ ; RV64-NEXT: ret
230
+ %res = call i16 @llvm.experimental.cttz.elts.i16.v8i1 (<8 x i1 > %a , i1 0 )
231
+ ret i16 %res
232
+ }
233
+
166
234
declare i64 @llvm.experimental.cttz.elts.i64.nxv8i16 (<vscale x 8 x i16 >, i1 )
167
235
declare i32 @llvm.experimental.cttz.elts.i32.nxv16i1 (<vscale x 16 x i1 >, i1 )
168
236
declare i32 @llvm.experimental.cttz.elts.i32.nxv4i32 (<vscale x 4 x i32 >, i1 )
237
+ declare i32 @llvm.experimental.cttz.elts.i32.v16i1 (<16 x i1 >, i1 )
238
+ declare i16 @llvm.experimental.cttz.elts.i16.v16i1 (<8 x i1 >, i1 )
169
239
170
240
attributes #0 = { vscale_range(2 ,1024 ) }
0 commit comments