cratedb-toolkit/cratedb_toolkit/query/llm/util.py at 39957e5241841334ca3ff91294d3b9a840fba6b0 · crate/cratedb-toolkit · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
# ty: ignore[unresolved-import]
from typing import Tuple

import llama_index.core
from langchain_openai import AzureOpenAIEmbeddings, OpenAIEmbeddings
from llama_index.core.base.embeddings.base import BaseEmbedding
from llama_index.core.llms import LLM
from llama_index.embeddings.langchain import LangchainEmbedding
from llama_index.llms.azure_openai import AzureOpenAI
from llama_index.llms.ollama import Ollama
from llama_index.llms.openai import OpenAI

from cratedb_toolkit.query.llm.model import ModelInfo, ModelProvider


def configure_llm(info: ModelInfo, debug: bool = False) -> Tuple[LLM, BaseEmbedding]:
    """
    Configure LLM access and model types. Use either vanilla Open AI, Azure Open AI, or Ollama.

    TODO: What about Hugging Face, Runpod, vLLM, and others?

    Notes about text embedding models:

    > The new model, `text-embedding-ada-002`, replaces five separate models for text search,
    > text similarity, and code search, and outperforms our previous most capable model,
    > Davinci, at most tasks, while being priced 99.8% lower.

    - https://openai.com/index/new-and-improved-embedding-model/
    - https://community.openai.com/t/models-embedding-vs-similarity-vs-search-models/291265
    """

    completion_model = info.completion
    embedding_model = info.embedding or "text-embedding-3-large"

    if not info.provider:
        raise ValueError("LLM model type not defined")
    if not completion_model:
        raise ValueError("LLM model name not defined")

    # https://docs.llamaindex.ai/en/stable/understanding/tracing_and_debugging/tracing_and_debugging/
    if debug:
        llama_index.core.set_global_handler("simple")

    if info.provider is ModelProvider.OPENAI:
        llm = OpenAI(
            model=completion_model,
            temperature=0.0,
            api_key=info.api_key,
            api_version=info.api_version,
        )
    elif info.provider is ModelProvider.AZURE:
        llm = AzureOpenAI(
            model=completion_model,
            temperature=0.0,
            engine=info.instance,
            azure_endpoint=info.endpoint,
            api_key=info.api_key,
            api_version=info.api_version,
        )
    elif info.provider is ModelProvider.OLLAMA:
        # https://docs.llamaindex.ai/en/stable/api_reference/llms/ollama/
        llm = Ollama(
            base_url=info.endpoint or "http://localhost:11434",
            model=completion_model,
            temperature=0.0,
            request_timeout=120.0,
            keep_alive=-1,
        )
    else:
        raise ValueError("LLM model type invalid: %s", info.provider)

    if info.provider is ModelProvider.OPENAI:
        embed_model = LangchainEmbedding(OpenAIEmbeddings(model=embedding_model))
    elif info.provider is ModelProvider.AZURE:
        embed_model = LangchainEmbedding(
            AzureOpenAIEmbeddings(
                azure_endpoint=info.endpoint,
                model=embedding_model,
            )
        )
    else:
        embed_model = "local"

    return llm, embed_model  # ty: ignore[invalid-return-type]