rpc: fix register position

thxCode · thxCode · commit b83034a41d90 · 2025-01-26T15:13:06.000+08:00
Signed-off-by: thxCode &lt;thxcode0824@gmail.com&gt;
diff --git a/common/arg.cpp b/common/arg.cpp
@@ -403,7 +403,7 @@ static void add_rpc_devices(std::string servers) {
     for (const auto & server : rpc_servers) {
         ggml_backend_dev_t dev = ggml_backend_rpc_add_device_fn(server.c_str());
         if (dev) {
-            ggml_backend_device_register(dev);
+            ggml_backend_device_register(dev, true);
         } else {
             throw std::invalid_argument("failed to register RPC device");
         }
diff --git a/ggml/include/ggml-backend.h b/ggml/include/ggml-backend.h
@@ -203,7 +203,7 @@ extern "C" {
     // Backend registry
     //
 
-    GGML_API void ggml_backend_device_register(ggml_backend_dev_t device);
+    GGML_API void ggml_backend_device_register(ggml_backend_dev_t device, bool front);
 
     // Backend (reg) enumeration
     GGML_API size_t             ggml_backend_reg_count(void);
diff --git a/ggml/src/ggml-backend-reg.cpp b/ggml/src/ggml-backend-reg.cpp
@@ -210,11 +210,15 @@ struct ggml_backend_registry {
         }
     }
 
-    void register_device(ggml_backend_dev_t device) {
+    void register_device(ggml_backend_dev_t device, bool front = false) {
 #ifndef NDEBUG
         GGML_LOG_DEBUG("%s: registered device %s (%s)\n", __func__, ggml_backend_dev_name(device), ggml_backend_dev_description(device));
 #endif
-        devices.push_back(device);
+        if (front) {
+            devices.insert(devices.begin(), device);
+        } else {
+            devices.push_back(device);
+        }
     }
 
     ggml_backend_reg_t load_backend(const std::wstring & path, bool silent) {
@@ -298,8 +302,8 @@ void ggml_backend_register(ggml_backend_reg_t reg) {
     get_reg().register_backend(reg);
 }
 
-void ggml_backend_device_register(ggml_backend_dev_t device) {
-    get_reg().register_device(device);
+void ggml_backend_device_register(ggml_backend_dev_t device, bool front) {
+    get_reg().register_device(device, front);
 }
 
 // Backend (reg) enumeration
diff --git a/src/llama-model.cpp b/src/llama-model.cpp
@@ -1303,10 +1303,12 @@ bool llama_model::load_tensors(llama_model_loader & ml) {
     const int act_gpu_layers = devices.empty() ? 0 : std::min(n_gpu_layers, (int)n_layer + 1);
     auto get_layer_buft_list = [&](int il) -> llama_model::impl::layer_dev {
         if (il < i_gpu_start || (il - i_gpu_start) >= act_gpu_layers) {
+            LLAMA_LOG_DEBUG("load_tensors: layer %3d assigned to device %s\n", il, ggml_backend_dev_name(cpu_dev));
             return {cpu_dev, &pimpl->cpu_buft_list};
         }
         const int layer_gpu = std::upper_bound(splits.begin(), splits.begin() + n_devices(), float(il - i_gpu_start)/act_gpu_layers) - splits.begin();
         auto * dev = devices.at(layer_gpu);
+        LLAMA_LOG_DEBUG("load_tensors: layer %3d assigned to device %s\n", il, ggml_backend_dev_name(dev));
         return {dev, &pimpl->gpu_buft_list.at(dev)};
     };
 

Original file line number	Diff line number	Diff line change
`@@ -403,7 +403,7 @@ static void add_rpc_devices(std::string servers) {`
`403`	`403`	`for (const auto & server : rpc_servers) {`
`404`	`404`	`ggml_backend_dev_t dev = ggml_backend_rpc_add_device_fn(server.c_str());`
`405`	`405`	`if (dev) {`
`406`		`- ggml_backend_device_register(dev);`
	`406`	`+ ggml_backend_device_register(dev, true);`
`407`	`407`	`} else {`
`408`	`408`	`throw std::invalid_argument("failed to register RPC device");`
`409`	`409`	`}`
Original file line number	Diff line number	Diff line change
`@@ -210,11 +210,15 @@ struct ggml_backend_registry {`
`210`	`210`	`}`
`211`	`211`	`}`
`212`	`212`
`213`		`- void register_device(ggml_backend_dev_t device) {`
	`213`	`+ void register_device(ggml_backend_dev_t device, bool front = false) {`
`214`	`214`	`#ifndef NDEBUG`
`215`	`215`	`GGML_LOG_DEBUG("%s: registered device %s (%s)\n", __func__, ggml_backend_dev_name(device), ggml_backend_dev_description(device));`
`216`	`216`	`#endif`
`217`		`- devices.push_back(device);`
	`217`	`+ if (front) {`
	`218`	`+ devices.insert(devices.begin(), device);`
	`219`	`+ } else {`
	`220`	`+ devices.push_back(device);`
	`221`	`+ }`
`218`	`222`	`}`
`219`	`223`
`220`	`224`	`ggml_backend_reg_t load_backend(const std::wstring & path, bool silent) {`
`@@ -298,8 +302,8 @@ void ggml_backend_register(ggml_backend_reg_t reg) {`
`298`	`302`	`get_reg().register_backend(reg);`
`299`	`303`	`}`
`300`	`304`
`301`		`-void ggml_backend_device_register(ggml_backend_dev_t device) {`
`302`		`- get_reg().register_device(device);`
	`305`	`+void ggml_backend_device_register(ggml_backend_dev_t device, bool front) {`
	`306`	`+ get_reg().register_device(device, front);`
`303`	`307`	`}`
`304`	`308`
`305`	`309`	`// Backend (reg) enumeration`