format

ch-wan · ch-wan · commit 1d609d1beb13 · 2025-04-16T05:47:56.000Z
diff --git a/python/sglang/srt/disaggregation/decode.py b/python/sglang/srt/disaggregation/decode.py
@@ -429,9 +429,9 @@ def event_loop_normal_disagg_decode(self):
             # polling and allocating kv cache
             self.process_decode_queue()
             batch = self.get_next_disagg_decode_batch_to_run()
-            
+
             is_real_batch = True
-            
+
             if batch and batch.forward_mode.is_extend():
                 self.cur_batch = batch
                 # Generate fake extend output.
@@ -442,9 +442,12 @@ def event_loop_normal_disagg_decode(self):
                 is_real_batch = False
 
             # Handle DP attention
-            if self.server_args.enable_dp_attention or self.server_args.enable_sp_layernorm:
+            if (
+                self.server_args.enable_dp_attention
+                or self.server_args.enable_sp_layernorm
+            ):
                 batch, _ = self.prepare_dp_attn_batch(batch)
-            
+
             if is_real_batch:
                 self.cur_batch = batch
 
diff --git a/python/sglang/srt/disaggregation/prefill.py b/python/sglang/srt/disaggregation/prefill.py
@@ -183,9 +183,12 @@ def event_loop_normal_disagg_prefill(self):
             )
             self.process_prefill_chunk()
             batch = self.get_new_batch_prefill()
-            
+
             # Handle DP attention
-            if self.server_args.enable_dp_attention or self.server_args.enable_sp_layernorm:
+            if (
+                self.server_args.enable_dp_attention
+                or self.server_args.enable_sp_layernorm
+            ):
                 batch, _ = self.prepare_dp_attn_batch(batch)
 
             self.cur_batch = batch
diff --git a/python/sglang/srt/managers/data_parallel_controller.py b/python/sglang/srt/managers/data_parallel_controller.py
@@ -24,12 +24,12 @@
 import zmq
 
 from sglang.srt.disaggregation.utils import DisaggregationMode
-from sglang.srt.managers.schedule_batch import Req
 from sglang.srt.layers.dp_attention import compute_dp_attention_world_info
 from sglang.srt.managers.io_struct import (
     TokenizedEmbeddingReqInput,
     TokenizedGenerateReqInput,
 )
+from sglang.srt.managers.schedule_batch import Req
 from sglang.srt.managers.scheduler import run_scheduler_process
 from sglang.srt.server_args import PortArgs, ServerArgs
 from sglang.srt.utils import bind_port, configure_logger, get_zmq_socket
@@ -225,7 +225,9 @@ def launch_tensor_parallel_group(
     def round_robin_scheduler(self, req: Req):
         if self.server_args.disaggregation_mode == DisaggregationMode.NULL:
             self.workers[self.round_robin_counter].send_pyobj(req)
-            self.round_robin_counter = (self.round_robin_counter + 1) % len(self.workers)
+            self.round_robin_counter = (self.round_robin_counter + 1) % len(
+                self.workers
+            )
         else:
             self.workers[req.bootstrap_room % len(self.workers)].send_pyobj(req)