openvinotoolkit
diff --git a/‎src/inference/dev_api/openvino/runtime/system_conf.hpp‎
Lines changed: 7 additions & 0 deletions b/‎src/inference/dev_api/openvino/runtime/system_conf.hpp‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎src/inference/src/system_conf.cpp‎
Lines changed: 7 additions & 0 deletions b/‎src/inference/src/system_conf.cpp‎
Lines changed: 7 additions & 0 deletions
diff --git a/‎src/plugins/intel_cpu/src/graph.cpp‎
Lines changed: 2 additions & 2 deletions b/‎src/plugins/intel_cpu/src/graph.cpp‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/convolution.cpp‎
Lines changed: 6 additions & 1 deletion b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/convolution.cpp‎
Lines changed: 6 additions & 1 deletion
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/convolution_backprop_data.cpp‎
Lines changed: 7 additions & 1 deletion b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/convolution_backprop_data.cpp‎
Lines changed: 7 additions & 1 deletion
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/matmul.cpp‎
Lines changed: 7 additions & 2 deletions b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/matmul.cpp‎
Lines changed: 7 additions & 2 deletions
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/pooling.cpp‎
Lines changed: 24 additions & 6 deletions b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/pooling.cpp‎
Lines changed: 24 additions & 6 deletions
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/pooling.hpp‎
Lines changed: 5 additions & 2 deletions b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/pooling.hpp‎
Lines changed: 5 additions & 2 deletions
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/softmax.cpp‎
Lines changed: 14 additions & 3 deletions b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/softmax.cpp‎
Lines changed: 14 additions & 3 deletions
diff --git a/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/softmax.hpp‎
Lines changed: 2 additions & 1 deletion b/‎src/plugins/intel_cpu/tests/functional/custom/single_layer_tests/classes/softmax.hpp‎
Lines changed: 2 additions & 1 deletion
@@ -146,6 +146,13 @@ OPENVINO_RUNTIME_API bool with_cpu_x86_avx512_core_amx_int8();
  */
 OPENVINO_RUNTIME_API bool with_cpu_x86_avx512_core_amx_bf16();
 
+/**
+ * @brief      Checks whether CPU supports AMX fp16 capability
+ * @ingroup    ov_dev_api_system_conf
+ * @return     `True` is tAMX_FP16 instructions are available, `false` otherwise
+ */
+OPENVINO_RUNTIME_API bool with_cpu_x86_avx512_core_amx_fp16();
+
 /**
  * @brief      Checks whether CPU supports AMX capability
  * @ingroup    ov_dev_api_system_conf
 
@@ -92,6 +92,10 @@ bool with_cpu_x86_avx512_core_amx_bf16() {
     return get_cpu_info().has(Xbyak::util::Cpu::tAMX_BF16);
 }
 
+bool with_cpu_x86_avx512_core_amx_fp16() {
+    return get_cpu_info().has(Xbyak::util::Cpu::tAMX_FP16);
+}
+
 bool with_cpu_x86_avx512_core_amx() {
     return with_cpu_x86_avx512_core_amx_int8() || with_cpu_x86_avx512_core_amx_bf16();
 }
@@ -131,6 +135,9 @@ bool with_cpu_x86_avx512_core_amx_int8() {
 bool with_cpu_x86_avx512_core_amx_bf16() {
     return false;
 }
+bool with_cpu_x86_avx512_core_amx_fp16() {
+    return false;
+}
 bool with_cpu_x86_avx512_core_amx() {
     return false;
 }
 
@@ -1832,7 +1832,7 @@ void Graph::EnforceInferencePrecision() {
 
         for (size_t i = 0; i < node->getOriginalInputsNumber(); i++) {
             auto keepOriginalInputPrecisionAtPort = [](const NodePtr& node, const size_t inPort) {
-                // keep non-float precisions
+                // keep non-float32 precisions
                 if (node->getOriginalInputPrecisionAtPort(inPort) != ov::element::f32)
                     return true;
 
@@ -1876,7 +1876,7 @@ void Graph::EnforceInferencePrecision() {
         }
 
         for (size_t i = 0; i < node->getOriginalOutputsNumber(); i++) {
-            // keep non-float precisions
+            // keep non-float32 precisions
             if (node->getOriginalOutputPrecisionAtPort(i) != ov::element::f32)
                 continue;
 
 
@@ -160,11 +160,16 @@ void ConvolutionLayerCPUTest::SetUp() {
     init_input_shapes({inputShape});
 
     auto it = configuration.find(ov::hint::inference_precision.name());
-    if (it != configuration.end() && it->second.as<ov::element::Type>() == ov::element::bf16) {
+    ov::element::Type inference_precision = (it != configuration.end()) ?
+                                            it->second.as<ov::element::Type>() : ov::element::undefined;
+    if (inference_precision == ov::element::bf16) {
         selectedType += "_BF16";
         rel_threshold = 1e-2f;
         if (selectedType == "jit_gemm_BF16")
             rel_threshold = 0.05f;
+    } else if (inference_precision == ov::element::f16) {
+            selectedType +=  "_FP16";
+            rel_threshold = 0.00125f;
     } else {
         selectedType = makeSelectedTypeStr(selectedType, netType);
     }
 
@@ -196,9 +196,15 @@ void DeconvolutionLayerCPUTest::SetUp() {
 
     std::tie(kernel, stride, padBegin, padEnd, dilation, convOutChannels, padType, outPadding) = basicParamsSet;
 
-    if (additionalConfig[ov::hint::inference_precision.name()] == ov::element::bf16) {
+    auto it = configuration.find(ov::hint::inference_precision.name());
+    ov::element::Type inference_precision = (it != configuration.end()) ?
+        it->second.as<ov::element::Type>() : ov::element::undefined;
+    if (inference_precision == ov::element::bf16) {
         inType = outType = prec = ElementType::bf16;
         rel_threshold = 1e-2f;
+    } else if (inference_precision == ov::element::f16) {
+        inType = outType = prec = ElementType::f16;
+        rel_threshold = 0.00125f;
     } else {
         inType = outType = prec;
     }
 
@@ -118,17 +118,22 @@ void MatMulLayerCPUTest::SetUp() {
     configuration.insert(additionalConfig.begin(), additionalConfig.end());
 
     auto it = additionalConfig.find(ov::hint::inference_precision.name());
-    if (it != additionalConfig.end() && it->second.as<ov::element::Type>() == ov::element::bf16) {
+    ov::element::Type inference_precision = (it != additionalConfig.end()) ?
+                                            it->second.as<ov::element::Type>() : ov::element::undefined;
+    if (inference_precision == ov::element::bf16) {
         inType = outType = netType = ElementType::bf16;
         rel_threshold = abs_threshold = 1e-2f;
+    } else if (inference_precision == ov::element::f16) {
+        inType = outType = netType = ElementType::f16;
+        rel_threshold = abs_threshold = 1e-4f;
     } else {
         inType = outType = netType;
         rel_threshold = 1e-4f;
         abs_threshold = 5e-4f;
     }
 
     cpuNodeType = nodeType == MatMulNodeType::MatMul ? "MatMul" : "FullyConnected";
-    selectedType = makeSelectedTypeStr(selectedType, outType);
+    selectedType = makeSelectedTypeStr(selectedType, deduce_expected_precision(outType, configuration));
 
     ov::ParameterVector params{std::make_shared<ov::op::v0::Parameter>(netType, inShapeA)};
 
 
@@ -19,7 +19,8 @@ std::string PoolingLayerCPUTest::getTestCaseName(const testing::TestParamInfo<po
     bool isInt8;
     CPUSpecificParams cpuParams;
     fusingSpecificParams fusingParams;
-    std::tie(basicParamsSet, inputShapes, inPrc, isInt8, cpuParams, fusingParams) = obj.param;
+    ov::AnyMap additionalConfig;
+    std::tie(basicParamsSet, inputShapes, inPrc, isInt8, cpuParams, fusingParams, additionalConfig) = obj.param;
 
     utils::PoolingTypes poolType;
     std::vector<size_t> kernel, stride;
@@ -53,6 +54,12 @@ std::string PoolingLayerCPUTest::getTestCaseName(const testing::TestParamInfo<po
     results << "Rounding=" << roundingType << "_";
     results << "AutoPad=" << padType << "_";
     results << "INT8=" << isInt8 << "_";
+    if (!additionalConfig.empty()) {
+        results << "_PluginConf";
+            for (auto& item : additionalConfig) {
+                results << "_" << item.first << "=" << item.second.as<std::string>();
+            }
+        }
 
     results << CPUTestsBase::getTestCaseName(cpuParams);
     results << CpuTestWithFusing::getTestCaseName(fusingParams);
@@ -68,7 +75,9 @@ void PoolingLayerCPUTest::SetUp() {
     bool isInt8;
     CPUSpecificParams cpuParams;
     fusingSpecificParams fusingParams;
-    std::tie(basicParamsSet, inputShapes, inPrc, isInt8, cpuParams, fusingParams) = this->GetParam();
+    ov::AnyMap additionalConfig;
+    std::tie(basicParamsSet, inputShapes, inPrc, isInt8, cpuParams, fusingParams, additionalConfig) = this->GetParam();
+    configuration.insert(additionalConfig.begin(), additionalConfig.end());
 
     utils::PoolingTypes poolType;
     std::vector<size_t> kernel, stride;
@@ -87,7 +96,7 @@ void PoolingLayerCPUTest::SetUp() {
     if (isInt8)
         selectedType = selectedType + "_I8";
     else
-        selectedType = makeSelectedTypeStr(selectedType, inPrc);
+        selectedType = makeSelectedTypeStr(selectedType, deduce_expected_precision(inPrc, configuration));
 
     init_input_shapes({inputShapes});
 
@@ -119,7 +128,8 @@ std::string MaxPoolingV8LayerCPUTest::getTestCaseName(
     InputShape inputShapes;
     ElementType inPrc;
     CPUSpecificParams cpuParams;
-    std::tie(basicParamsSet, inputShapes, inPrc, cpuParams) = obj.param;
+    ov::AnyMap additionalConfig;
+    std::tie(basicParamsSet, inputShapes, inPrc, cpuParams, additionalConfig) = obj.param;
 
     std::vector<size_t> kernel, stride, dilation;
     std::vector<size_t> padBegin, padEnd;
@@ -146,6 +156,12 @@ std::string MaxPoolingV8LayerCPUTest::getTestCaseName(
     results << "PE" << ov::test::utils::vec2str(padEnd) << "_";
     results << "Rounding=" << roundingType << "_";
     results << "AutoPad=" << padType << "_";
+    if (!additionalConfig.empty()) {
+        results << "_PluginConf";
+        for (auto& item : additionalConfig) {
+            results << "_" << item.first << "=" << item.second.as<std::string>();
+        }
+    }
 
     results << CPUTestsBase::getTestCaseName(cpuParams);
     return results.str();
@@ -158,7 +174,9 @@ void MaxPoolingV8LayerCPUTest::SetUp() {
     InputShape inputShapes;
     ElementType inPrc;
     CPUSpecificParams cpuParams;
-    std::tie(basicParamsSet, inputShapes, inPrc, cpuParams) = this->GetParam();
+    ov::AnyMap additionalConfig;
+    std::tie(basicParamsSet, inputShapes, inPrc, cpuParams, additionalConfig) = this->GetParam();
+    configuration.insert(additionalConfig.begin(), additionalConfig.end());
 
     std::vector<size_t> kernel, stride, dilation;
     std::vector<size_t> padBegin, padEnd;
@@ -172,7 +190,7 @@ void MaxPoolingV8LayerCPUTest::SetUp() {
     if (selectedType.empty()) {
         selectedType = getPrimitiveType();
     }
-    selectedType = makeSelectedTypeStr(selectedType, inPrc);
+    selectedType = makeSelectedTypeStr(selectedType, deduce_expected_precision(inPrc, configuration));
 
     init_input_shapes({inputShapes});
 
 
@@ -19,12 +19,15 @@ using poolLayerCpuTestParamsSet = std::tuple<poolSpecificParams,
                                              ElementType, //inPrc
                                              bool, // isInt8
                                              CPUSpecificParams,
-                                             fusingSpecificParams>;
+                                             fusingSpecificParams,
+                                             ov::AnyMap>;
+
 
 using maxPoolV8LayerCpuTestParamsSet = std::tuple<maxPoolV8SpecificParams,
         InputShape,
         ElementType,
-        CPUSpecificParams>;
+        CPUSpecificParams,
+        ov::AnyMap>;
 
 class PoolingLayerCPUTest : public testing::WithParamInterface<poolLayerCpuTestParamsSet>,
                             virtual public SubgraphBaseTest, public CpuTestWithFusing {
 
@@ -16,7 +16,8 @@ std::string SoftMaxLayerCPUTest::getTestCaseName(const testing::TestParamInfo<so
     ElementType inType;
     SoftMaxConfig config;
     std::string targetDevice;
-    std::tie(inType, config, targetDevice, cpuParams) = obj.param;
+    ov::AnyMap additionalConfig;
+    std::tie(inType, config, targetDevice, cpuParams, additionalConfig) = obj.param;
 
     std::ostringstream result;
     result << "netPRC=" << inType << "_";
@@ -30,6 +31,12 @@ std::string SoftMaxLayerCPUTest::getTestCaseName(const testing::TestParamInfo<so
     result << "axis=" << config.axis << "_";
     result << "trgDev=" << targetDevice;
     result << CPUTestsBase::getTestCaseName(cpuParams);
+    if (!additionalConfig.empty()) {
+        result << "_PluginConf";
+        for (auto& item : additionalConfig) {
+            result << "_" << item.first << "=" << item.second.as<std::string>();
+        }
+    }
 
     return result.str();
 }
@@ -38,7 +45,9 @@ void SoftMaxLayerCPUTest::SetUp() {
     ElementType inType;
     SoftMaxConfig config;
     CPUSpecificParams cpuParams;
-    std::tie(inType, config, targetDevice, cpuParams) = this->GetParam();
+    ov::AnyMap additionalConfig;
+    std::tie(inType, config, targetDevice, cpuParams, additionalConfig) = this->GetParam();
+    configuration.insert(additionalConfig.begin(), additionalConfig.end());
 
     std::tie(inFmts, outFmts, priority, selectedType) = cpuParams;
     if (selectedType.empty()) {
@@ -47,8 +56,10 @@ void SoftMaxLayerCPUTest::SetUp() {
 
     if (inType == ElementType::bf16) {
         rel_threshold = 2e-2f;
+    } else if (inType == ElementType::f16) {
+        rel_threshold = 0.0025f;
     }
-    selectedType = makeSelectedTypeStr(selectedType, inType);
+    selectedType = makeSelectedTypeStr(selectedType, deduce_expected_precision(inType, configuration));
     init_input_shapes({config.inputShape});
     ov::ParameterVector params;
     for (auto&& shape : inputDynamicShapes)
 
@@ -18,7 +18,8 @@ struct SoftMaxConfig {
 typedef std::tuple<ElementType,    // netPrecision
                    SoftMaxConfig,  // softmaxTestConfig
                    std::string,    // targetDevice
-                   CPUSpecificParams>
+                   CPUSpecificParams,
+                   ov::AnyMap> //device_config
     softmaxCPUTestParams;
 
 class SoftMaxLayerCPUTest : public testing::WithParamInterface<softmaxCPUTestParams>,
Original file line number	Diff line number	Diff line change
`@@ -92,6 +92,10 @@ bool with_cpu_x86_avx512_core_amx_bf16() {`
`92`	`92`	`return get_cpu_info().has(Xbyak::util::Cpu::tAMX_BF16);`
`93`	`93`	`}`
`94`	`94`
	`95`	`+bool with_cpu_x86_avx512_core_amx_fp16() {`
	`96`	`+ return get_cpu_info().has(Xbyak::util::Cpu::tAMX_FP16);`
	`97`	`+}`
	`98`	`+`
`95`	`99`	`bool with_cpu_x86_avx512_core_amx() {`
`96`	`100`	`return with_cpu_x86_avx512_core_amx_int8() \|\| with_cpu_x86_avx512_core_amx_bf16();`
`97`	`101`	`}`
`@@ -131,6 +135,9 @@ bool with_cpu_x86_avx512_core_amx_int8() {`
`131`	`135`	`bool with_cpu_x86_avx512_core_amx_bf16() {`
`132`	`136`	`return false;`
`133`	`137`	`}`
	`138`	`+bool with_cpu_x86_avx512_core_amx_fp16() {`
	`139`	`+ return false;`
	`140`	`+}`
`134`	`141`	`bool with_cpu_x86_avx512_core_amx() {`
`135`	`142`	`return false;`
`136`	`143`	`}`