test auto vectorize

wzssyqa · wzssyqa · commit 90f25cd15ea3 · 2024-10-23T09:59:31.000+08:00
diff --git a/clang/test/CodeGen/fmaxnum_fminnum_use_nsz.c b/clang/test/CodeGen/fmaxnum_fminnum_use_nsz.c
@@ -1,5 +1,5 @@
-// RUN: %clang_cc1 -triple x86_64 %s -emit-llvm -o - 2>&1 | FileCheck %s --check-prefix=CHECK
-// RUN: %clang_cc1 -ffp-exception-behavior=strict -triple x86_64 %s -emit-llvm -o - 2>&1 | FileCheck %s --check-prefix=CHECK-STRICT
+// RUN: %clang_cc1 -vectorize-loops -vectorize-slp -O3 -triple x86_64 %s -emit-llvm -o - 2>&1 | FileCheck %s --check-prefix=CHECK
+// RUN: %clang_cc1 -vectorize-loops -vectorize-slp -O3 -ffp-exception-behavior=strict -DENSTRICT=1 -triple x86_64 %s -emit-llvm -o - 2>&1 | FileCheck %s --check-prefix=CHECK-STRICT
 
 float fminf (float, float);
 double fmin (double, double);
@@ -18,6 +18,20 @@ float fmin32(float a, float b) {
 float fmin32b(float a, float b) {
         return __builtin_fminf(a, b);
 }
+#if !defined(ENSTRICT)
+// CHECK: call nsz <4 x float> @llvm.minnum.v4f32(<4 x float> %0, <4 x float> %1)
+float *pfmin32(float* a, float* b, float* restrict c) {
+	for (int i=0; i<4; i++)
+		c[i] = fminf(a[i], b[i]);
+	return c;
+}
+// CHECK: call nsz <4 x float> @llvm.minnum.v4f32(<4 x float> %0, <4 x float> %1)
+float *pfmin32b(float* a, float* b, float* restrict c) {
+	for (int i=0; i<4; i++)
+		c[i] = __builtin_fminf(a[i], b[i]);
+	return c;
+}
+#endif
 // CHECK: call nsz double @llvm.minnum.f64
 // CHECK-STRICT: call nsz double @llvm.experimental.constrained.minnum.f64{{.*}} #2
 float fmin64(double a, double b) {
@@ -28,6 +42,20 @@ float fmin64(double a, double b) {
 float fmin64b(double a, double b) {
         return __builtin_fmin(a, b);
 }
+#if !defined(ENSTRICT)
+// CHECK: call nsz <2 x double> @llvm.minnum.v2f64(<2 x double> %0, <2 x double> %1)
+double *pfmin64(double* a, double* b, double* restrict c) {
+	for (int i=0; i<2; i++)
+		c[i] = fmin(a[i], b[i]);
+	return c;
+}
+// CHECK: call nsz <2 x double> @llvm.minnum.v2f64(<2 x double> %0, <2 x double> %1)
+double *pfmin64b(double* a, double* b, double* restrict c) {
+	for (int i=0; i<2; i++)
+		c[i] = __builtin_fmin(a[i], b[i]);
+	return c;
+}
+#endif
 // CHECK: call nsz x86_fp80 @llvm.minnum.f80
 // CHECK-STRICT: call nsz x86_fp80 @llvm.experimental.constrained.minnum.f80{{.*}} #2
 float fmin80(long double a, long double b) {
@@ -48,6 +76,20 @@ float fmax32(float a, float b) {
 float fmax32b(float a, float b) {
         return __builtin_fmaxf(a, b);
 }
+#if !defined(ENSTRICT)
+// CHECK: call nsz <4 x float> @llvm.maxnum.v4f32(<4 x float> %0, <4 x float> %1)
+float *pfmax32(float* a, float* b, float* restrict c) {
+	for (int i=0; i<4; i++)
+		c[i] = fmaxf(a[i], b[i]);
+	return c;
+}
+// CHECK: call nsz <4 x float> @llvm.maxnum.v4f32(<4 x float> %0, <4 x float> %1)
+float *pfmax32b(float* a, float* b, float* restrict c) {
+	for (int i=0; i<4; i++)
+		c[i] = __builtin_fmaxf(a[i], b[i]);
+	return c;
+}
+#endif
 // CHECK: call nsz double @llvm.maxnum.f64
 // CHECK-STRICT: call nsz double @llvm.experimental.constrained.maxnum.f64{{.*}} #2
 float fmax64(double a, double b) {
@@ -63,6 +105,20 @@ float fmax64b(double a, double b) {
 float fmax3(long double a, long double b) {
         return fmaxl(a, b);
 }
+#if !defined(ENSTRICT)
+// CHECK: call nsz <2 x double> @llvm.maxnum.v2f64(<2 x double> %0, <2 x double> %1)
+double *pfmax64(double* a, double* b, double* restrict c) {
+	for (int i=0; i<2; i++)
+		c[i] = fmax(a[i], b[i]);
+	return c;
+}
+// CHECK: call nsz <2 x double> @llvm.maxnum.v2f64(<2 x double> %0, <2 x double> %1)
+double *pfmax64b(double* a, double* b, double* restrict c) {
+	for (int i=0; i<2; i++)
+		c[i] = __builtin_fmax(a[i], b[i]);
+	return c;
+}
+#endif
 // CHECK: call nsz x86_fp80 @llvm.maxnum.f80
 // CHECK-STRICT: call nsz x86_fp80 @llvm.experimental.constrained.maxnum.f80{{.*}} #2
 float fmax80b(long double a, long double b) {