tobi
diff --git a/‎README.md‎
Lines changed: 5 additions & 2 deletions b/‎README.md‎
Lines changed: 5 additions & 2 deletions
diff --git a/‎bun.lock‎
Lines changed: 41 additions & 22 deletions b/‎bun.lock‎
Lines changed: 41 additions & 22 deletions
diff --git a/‎src/cli/qmd.ts‎
Lines changed: 2 additions & 0 deletions b/‎src/cli/qmd.ts‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src/openai-llm.ts‎
Lines changed: 1 addition & 1 deletion b/‎src/openai-llm.ts‎
Lines changed: 1 addition & 1 deletion
@@ -524,17 +524,20 @@ As an alternative to local embedding models, you can use OpenAI's API for faster
 embedding:
   provider: openai
   openai:
-    api_key: sk-...  # Optional, falls back to OPENAI_API_KEY env var
+    api_key: sk-...  # Optional, falls back to QMD_OPENAI_API_KEY or OPENAI_API_KEY env var
     model: text-embedding-3-small  # Optional, this is the default
+    expansion_model: gpt-4o-mini  # Optional, model for query expansion/reranking
+    base_url: https://api.openai.com/v1  # Optional, for OpenAI-compatible APIs (Ollama, vLLM, etc.)
 ```
 
 Benefits:
 - **~10x faster** than local CPU inference
 - **No GPU required** - works on any machine
 - **More reliable** - no local model loading issues
 - **Cost:** ~$0.02 per 1M tokens (very cheap)
+- **OpenAI-compatible** - works with Ollama, vLLM, Azure, and other compatible APIs via `base_url`
 
-When using OpenAI embeddings, query expansion and reranking are skipped to avoid loading local models.
+When using OpenAI embeddings, query expansion and reranking use the OpenAI API instead of local models.
 
 ## Installation
 
 
@@ -2826,6 +2826,8 @@ if (isMain) {
       openai: {
         apiKey: embeddingYamlConfig.openai?.api_key,
         embedModel: embeddingYamlConfig.openai?.model,
+        expansionModel: embeddingYamlConfig.openai?.expansion_model,
+        baseURL: embeddingYamlConfig.openai?.base_url,
       },
     });
   }
 
@@ -106,7 +106,7 @@ export class OpenAIEmbedding implements LLM {
 
   constructor(config: OpenAIConfig = {}) {
     this.client = new OpenAI({ 
-      apiKey: config.apiKey || process.env.OPENAI_API_KEY,
+      apiKey: config.apiKey || process.env.QMD_OPENAI_API_KEY || process.env.OPENAI_API_KEY,
       baseURL: config.baseURL,
     });
     this.embedModel = config.embedModel || DEFAULT_EMBED_MODEL;
Original file line number	Diff line number	Diff line change
`@@ -2826,6 +2826,8 @@ if (isMain) {`
`2826`	`2826`	`openai: {`
`2827`	`2827`	`apiKey: embeddingYamlConfig.openai?.api_key,`
`2828`	`2828`	`embedModel: embeddingYamlConfig.openai?.model,`
	`2829`	`+ expansionModel: embeddingYamlConfig.openai?.expansion_model,`
	`2830`	`+ baseURL: embeddingYamlConfig.openai?.base_url,`
`2829`	`2831`	`},`
`2830`	`2832`	`});`
`2831`	`2833`	`}`