[XPU] fix weight scale shape (#42725)

zufangzhu · jikunshang · web-flow · commit 0fa888465e5a · 2026-05-17T16:55:10.000+08:00
Signed-off-by: Zhu, Zufang &lt;zufang.zhu@intel.com&gt;
Co-authored-by: Kunshang Ji &lt;kunshang.ji@intel.com&gt;
diff --git a/vllm/model_executor/kernels/linear/scaled_mm/xpu.py b/vllm/model_executor/kernels/linear/scaled_mm/xpu.py
@@ -59,6 +59,9 @@ def process_weights_after_loading(self, layer: torch.nn.Module) -> None:
             replace_parameter(layer, "weight", weight.data.t())
         # else: already in [in, out] layout — no-op
 
+        weight_scale = layer.weight_scale.t().contiguous()
+        replace_parameter(layer, "weight_scale", weight_scale.data)
+
     def apply_weights(
         self,
         layer: torch.nn.Module,