add attention tests

shubhambhokare1 · shubhambhokare1 · commit 1a0329a9ac0b · 2025-04-29T20:21:17.000Z
diff --git a/onnxscript/rewriter/ort_fusions/attention_test.py b/onnxscript/rewriter/ort_fusions/attention_test.py
@@ -10,11 +10,13 @@
 
 import onnxscript
 import onnxscript.ir as ir
+import onnxscript.optimizer
 import onnxscript.rewriter.ort_fusions._core as xformers
 from onnxscript import FLOAT, script
 from onnxscript import opset18 as op
 from onnxscript.ir.passes.common import shape_inference
 from onnxscript.rewriter.ort_fusions._test_utils import ORT_VERSION, assert_allclose, ort_run
+from onnxscript.rewriter.ort_fusions.models._whisper_encoder import whisper_encoder_test
 
 msft_op = onnxscript.values.Opset("com.microsoft", 1)
 
@@ -155,6 +157,35 @@ def test_model_with_mha(self, name, with_past):
             new_outputs = ort_run("optimized", model, inputs)
             assert_allclose(new_outputs, original_outputs)
 
+    def test_whisper_encoder(self):
+        # Generate model
+        whisper_encoder = whisper_encoder_test()
+        model = whisper_encoder.get_onnx_model()
+        onnxscript.optimizer.optimize(model)
+
+        test_with_ort = packaging.version.Version("1.20") <= ORT_VERSION
+        if test_with_ort:
+            # Run model
+            inputs = whisper_encoder.get_ort_inputs()
+            original_outputs = ort_run("original", model, inputs)
+
+        # Fuse SDPA and MHA
+        sdpa_count = xformers.fuse_sdpa(model)
+        self.assertGreater(sdpa_count, 0)
+        model = shape_inference.infer_shapes(model)
+        mha_count = xformers.fuse_mha(model)
+        self.assertGreater(mha_count, 0)
+        fused_mha_bias_count = xformers.fuse_mha_bias(model)
+        self.assertGreater(fused_mha_bias_count, 0)
+        attention_count = xformers.fuse_attention(model)
+        self.assertGreater(attention_count, 0)
+        onnxscript.optimizer.optimize(model)
+
+        if test_with_ort:
+            # Run model again
+            new_outputs = ort_run("optimized", model, inputs)
+            assert_allclose(new_outputs, original_outputs)
+
 
 if __name__ == "__main__":
     unittest.main()
diff --git a/onnxscript/rewriter/ort_fusions/models/_whisper_encoder.py b/onnxscript/rewriter/ort_fusions/models/_whisper_encoder.py
@@ -147,7 +147,7 @@ def main_graph(
             epsilon=9.999999747378752e-06,
             axis=-1,
         )
-        return layer_norm_2
+        return add_170
 
     model = main_graph.to_model_proto()
     return model

Original file line number	Diff line number	Diff line change
`@@ -147,7 +147,7 @@ def main_graph(`
`147`	`147`	`epsilon=9.999999747378752e-06,`
`148`	`148`	`axis=-1,`
`149`	`149`	`)`
`150`		`- return layer_norm_2`
	`150`	`+ return add_170`
`151`	`151`
`152`	`152`	`model = main_graph.to_model_proto()`
`153`	`153`	`return model`