feat: add preload_model option to OllamaModel for faster client initialization

duranbe · duranbe · commit e795c2469283 · 2025-12-24T11:57:51.000+01:00
diff --git a/src/raglight/llm/ollama_model.py b/src/raglight/llm/ollama_model.py
@@ -27,6 +27,7 @@ def __init__(
         options: Optional[Dict] = None,
         system_prompt: Optional[str] = None,
         system_prompt_file: Optional[str] = None,
+        preload_model: Optional[bool] = False,
         api_base: Optional[str] = None,
         role: str = "user",
         headers: Optional[Mapping[str, str]] = None,
@@ -44,10 +45,11 @@ def __init__(
         """
         self.api_base = api_base or Settings.DEFAULT_OLLAMA_CLIENT
         self.headers = headers
+        self.preload_model = preload_model
+        self.options = options
         super().__init__(model_name, system_prompt, system_prompt_file, self.api_base)
         logging.info(f"Using Ollama with {model_name} model 🤖")
         self.role: str = role
-        self.options = options
 
     @override
     def load(self) -> Client:
@@ -57,7 +59,15 @@ def load(self) -> Client:
         Returns:
             Client: An instance of the Ollama model client, configured with the necessary host and headers.
         """
-        return Client(host=self.api_base, headers=self.headers)
+        ollama_client = Client(host=self.api_base, headers=self.headers)
+
+        if self.preload_model:
+            ollama_client.chat(
+                model=self.model_name,
+                messages=[],
+                options=self.options,
+            )
+        return ollama_client
 
     @override
     def generate(self, input: Dict[str, Any]) -> str: