Add Groq Support (#1481)

2024-07-16 23:33:28 +05:30
parent 80f145fceb
commit 19637804b3
11 changed files with 369 additions and 6 deletions
--- a/docs/llms.mdx
+++ b/docs/llms.mdx
@@ -0,0 +1,66 @@
+---
+title: 🤖 Large language models (LLMs)
+---
+
+## Overview
+
+Mem0 includes built-in support for various popular large language models. Memory can utilize the LLM provided by the user, ensuring efficient use for specific needs.
+
+<CardGroup cols={4}>
+  <Card title="OpenAI" href="#openai"></Card>
+  <Card title="Groq" href="#groq"></Card>
+</CardGroup>
+
+## OpenAI
+
+To use OpenAI LLM models, you have to set the `OPENAI_API_KEY` environment variable. You can obtain the OpenAI API key from the [OpenAI Platform](https://platform.openai.com/account/api-keys).
+
+Once you have obtained the key, you can use it like this:
+
+```python
+import os
+from mem0 import Memory
+
+os.environ['OPENAI_API_KEY'] = 'xxx'
+
+config = {
+    "llm": {
+        "provider": "openai",
+        "config": {
+            "model": "gpt-4o",
+            "temperature": 0.2,
+            "max_tokens": 1500,
+        }
+    }
+}
+
+m = Memory.from_config(config)
+m.add("Likes to play cricket on weekends", user_id="alice", metadata={"category": "hobbies"})
+```
+
+## Groq
+
+[Groq](https://groq.com/) is the creator of the world's first Language Processing Unit (LPU), providing exceptional speed performance for AI workloads running on their LPU Inference Engine.
+
+In order to use LLMs from Groq, go to their [platform](https://console.groq.com/keys) and get the API key. Set the API key as `GROQ_API_KEY` environment variable to use the model as given below in the example.
+
+```python
+import os
+from mem0 import Memory
+
+os.environ['GROQ_API_KEY'] = 'xxx'
+
+config = {
+    "llm": {
+        "provider": "groq",
+        "config": {
+            "model": "mixtral-8x7b-32768",
+            "temperature": 0.1,
+            "max_tokens": 1000,
+        }
+    }
+}
+
+m = Memory.from_config(config)
+m.add("Likes to play cricket on weekends", user_id="alice", metadata={"category": "hobbies"})
+```
--- a/docs/mint.json
+++ b/docs/mint.json
@@ -53,6 +53,12 @@
        "quickstart"
      ]
    },
+    {
+      "group": "LLMs",
+      "pages": [
+        "llms"
+      ]
+    },
    {
      "group": "💡 Examples",
      "pages": [
--- a/mem0/embeddings/configs.py
+++ b/mem0/embeddings/configs.py
@@ -0,0 +1,22 @@
+from typing import Optional
+
+from pydantic import BaseModel, Field, field_validator
+
+
+class EmbedderConfig(BaseModel):
+    provider: str = Field(
+        description="Provider of the embedding model (e.g., 'ollama', 'openai')",
+        default="openai",
+    )
+    config: Optional[dict] = Field(
+        description="Configuration for the specific embedding model", default=None
+    )
+
+    @field_validator("config")
+    def validate_config(cls, v, values):
+        provider = values.data.get("provider")
+        if provider in ["openai", "ollama"]:
+            return v
+        else:
+            raise ValueError(f"Unsupported embedding provider: {provider}")
+        
--- a/mem0/llms/configs.py
+++ b/mem0/llms/configs.py
@@ -0,0 +1,21 @@
+from typing import Optional
+
+from pydantic import BaseModel, Field, field_validator
+
+
+class LlmConfig(BaseModel):
+    provider: str = Field(
+        description="Provider of the LLM (e.g., 'ollama', 'openai')", default="openai"
+    )
+    config: Optional[dict] = Field(
+        description="Configuration for the specific LLM", default=None
+    )
+
+    @field_validator("config")
+    def validate_config(cls, v, values):
+        provider = values.data.get("provider")
+        if provider in ["openai", "ollama", "groq"]:
+            return v
+        else:
+            raise ValueError(f"Unsupported LLM provider: {provider}")
+        
--- a/mem0/llms/groq.py
+++ b/mem0/llms/groq.py
@@ -0,0 +1,40 @@
+from typing import Dict, List, Optional
+
+from groq import Groq
+
+from mem0.llms.base import LLMBase
+
+
+class GroqLLM(LLMBase):
+    def __init__(self, model="llama3-70b-8192"):
+        self.client = Groq()
+        self.model = model
+
+    def generate_response(
+        self,
+        messages: List[Dict[str, str]],
+        response_format=None,
+        tools: Optional[List[Dict]] = None,
+        tool_choice: str = "auto",
+    ):
+        """
+        Generate a response based on the given messages using Groq.
+
+        Args:
+            messages (list): List of message dicts containing 'role' and 'content'.
+            response_format (str or object, optional): Format of the response. Defaults to "text".
+            tools (list, optional): List of tools that the model can call. Defaults to None.
+            tool_choice (str, optional): Tool choice method. Defaults to "auto".
+
+        Returns:
+            str: The generated response.
+        """
+        params = {"model": self.model, "messages": messages}
+        if response_format:
+            params["response_format"] = response_format
+        if tools:
+            params["tools"] = tools
+            params["tool_choice"] = tool_choice
+
+        response = self.client.chat.completions.create(**params)
+        return response
--- a/mem0/memory/main.py
+++ b/mem0/memory/main.py
@@ -7,8 +7,6 @@ from typing import Any, Dict, Optional

 from pydantic import BaseModel, Field, ValidationError

-from mem0.embeddings.openai import OpenAIEmbedding
-from mem0.llms.openai import OpenAILLM
 from mem0.llms.utils.tools import (
    ADD_MEMORY_TOOL,
    DELETE_MEMORY_TOOL,
@@ -21,7 +19,10 @@ from mem0.memory.storage import SQLiteManager
 from mem0.memory.telemetry import capture_event
 from mem0.memory.utils import get_update_memory_messages
 from mem0.vector_stores.configs import VectorStoreConfig
+from mem0.llms.configs import LlmConfig
+from mem0.embeddings.configs import EmbedderConfig
 from mem0.vector_stores.qdrant import Qdrant
+from mem0.utils.factory import LlmFactory, EmbedderFactory

 # Setup user config
 setup_config()
@@ -44,6 +45,14 @@ class MemoryConfig(BaseModel):
        description="Configuration for the vector store",
        default_factory=VectorStoreConfig,
    )
+    llm: LlmConfig = Field(
+        description="Configuration for the language model",
+        default_factory=LlmConfig,
+    )
+    embedder: EmbedderConfig = Field(
+        description="Configuration for the embedding model",
+        default_factory=EmbedderConfig,
+    )
    history_db_path: str = Field(
        description="Path to the history database",
        default=os.path.join(mem0_dir, "history.db"),
@@ -57,7 +66,7 @@ class MemoryConfig(BaseModel):
 class Memory(MemoryBase):
    def __init__(self, config: MemoryConfig = MemoryConfig()):
        self.config = config
-        self.embedding_model = OpenAIEmbedding()
+        self.embedding_model = EmbedderFactory.create(self.config.embedder.provider)
        # Initialize the appropriate vector store based on the configuration
        vector_store_config = self.config.vector_store.config
        if self.config.vector_store.provider == "qdrant":
@@ -73,7 +82,7 @@ class Memory(MemoryBase):
                f"Unsupported vector store type: {self.config.vector_store_type}"
            )

-        self.llm = OpenAILLM()
+        self.llm = LlmFactory.create(self.config.llm.provider)
        self.db = SQLiteManager(self.config.history_db_path)
        self.collection_name = self.config.collection_name
        self.vector_store.create_col(
--- a/mem0/utils/factory.py
+++ b/mem0/utils/factory.py
@@ -0,0 +1,41 @@
+import importlib
+
+
+def load_class(class_type):
+    module_path, class_name = class_type.rsplit(".", 1)
+    module = importlib.import_module(module_path)
+    return getattr(module, class_name)
+
+
+class LlmFactory:
+    provider_to_class = {
+        "ollama": "mem0.llms.ollama.py.OllamaLLM",
+        "openai": "mem0.llms.openai.OpenAILLM",
+        "groq": "mem0.llms.groq.GroqLLM"
+    }
+
+    @classmethod
+    def create(cls, provider_name):
+        class_type = cls.provider_to_class.get(provider_name)
+        if class_type:
+            llm_instance = load_class(class_type)()
+            return llm_instance
+        else:
+            raise ValueError(f"Unsupported Llm provider: {provider_name}")
+        
+class EmbedderFactory:
+    provider_to_class = {
+        "openai": "mem0.embeddings.openai.OpenAIEmbedding",
+        "ollama": "mem0.embeddings.ollama.OllamaEmbedding",
+        "huggingface": "mem0.embeddings.huggingface.HuggingFaceEmbedding"
+    }
+
+    @classmethod
+    def create(cls, provider_name):
+        class_type = cls.provider_to_class.get(provider_name)
+        if class_type:
+            embedder_instance = load_class(class_type)()
+            return embedder_instance
+        else:
+            raise ValueError(f"Unsupported Embedder provider: {provider_name}")
+        
--- a/poetry.lock
+++ b/poetry.lock
@@ -1,4 +1,4 @@
-# This file is automatically @generated by Poetry 1.5.1 and should not be changed by hand.
+# This file is automatically @generated by Poetry 1.8.3 and should not be changed by hand.

 [[package]]
 name = "annotated-types"
@@ -370,6 +370,25 @@ files = [
 [package.extras]
 tests = ["asttokens (>=2.1.0)", "coverage", "coverage-enable-subprocess", "ipython", "littleutils", "pytest", "rich"]

+[[package]]
+name = "groq"
+version = "0.9.0"
+description = "The official Python library for the groq API"
+optional = false
+python-versions = ">=3.7"
+files = [
+    {file = "groq-0.9.0-py3-none-any.whl", hash = "sha256:d0e46f4ad645504672bb09c8100af3ced3a7db0d5119dc13e4aca535fc455874"},
+    {file = "groq-0.9.0.tar.gz", hash = "sha256:130ed5e35d3acfaab46b9e7a078eeaebf91052f4a9d71f86f87fb319b5fec332"},
+]
+
+[package.dependencies]
+anyio = ">=3.5.0,<5"
+distro = ">=1.7.0,<2"
+httpx = ">=0.23.0,<1"
+pydantic = ">=1.9.0,<3"
+sniffio = "*"
+typing-extensions = ">=4.7,<5"
+
 [[package]]
 name = "grpcio"
 version = "1.64.1"
@@ -1707,4 +1726,4 @@ test = ["big-O", "importlib-resources", "jaraco.functools", "jaraco.itertools",
 [metadata]
 lock-version = "2.0"
 python-versions = "^3.8"
-content-hash = "5138c101a58db8dbddcb640545a5b2b4fc482f9e555008d117e315ae292d7697"
+content-hash = "7216c3479e9bce779f99016825bfb726399ffb0ac5f942ac73b899fc373efd37"
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -20,6 +20,7 @@ qdrant-client = "^1.9.1"
 pydantic = "^2.7.3"
 openai = "^1.33.0"
 posthog = "^3.5.0"
+groq = "^0.9.0"


 [tool.poetry.group.test.dependencies]
--- a/tests/llms/test_groq.py
+++ b/tests/llms/test_groq.py
@@ -0,0 +1,69 @@
+import pytest
+from unittest.mock import Mock, patch
+from mem0.llms.groq import GroqLLM
+
+@pytest.fixture
+def mock_groq_client():
+    with patch('mem0.llms.groq.Groq') as mock_groq:
+        mock_client = Mock()
+        mock_groq.return_value = mock_client
+        yield mock_client
+
+
+def test_generate_response_without_tools(mock_groq_client):
+    llm = GroqLLM()
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Hello, how are you?"}
+    ]
+    
+    mock_response = Mock()
+    mock_response.choices = [Mock(message=Mock(content="I'm doing well, thank you for asking!"))]
+    mock_groq_client.chat.completions.create.return_value = mock_response
+
+    response = llm.generate_response(messages)
+
+    mock_groq_client.chat.completions.create.assert_called_once_with(
+        model="llama3-70b-8192",
+        messages=messages
+    )
+    assert response.choices[0].message.content == "I'm doing well, thank you for asking!"
+
+
+def test_generate_response_with_tools(mock_groq_client):
+    llm = GroqLLM()
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Add a new memory: Today is a sunny day."}
+    ]
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "add_memory",
+                "description": "Add a memory",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "data": {"type": "string", "description": "Data to add to memory"}
+                    },
+                    "required": ["data"],
+                },
+            },
+        }
+    ]
+    
+    mock_response = Mock()
+    mock_response.choices = [Mock(message=Mock(content="Memory added successfully."))]
+    mock_groq_client.chat.completions.create.return_value = mock_response
+
+    response = llm.generate_response(messages, tools=tools)
+
+    mock_groq_client.chat.completions.create.assert_called_once_with(
+        model="llama3-70b-8192",
+        messages=messages,
+        tools=tools,
+        tool_choice="auto"
+    )
+    assert response.choices[0].message.content == "Memory added successfully."
+    
--- a/tests/llms/test_openai.py
+++ b/tests/llms/test_openai.py
@@ -0,0 +1,69 @@
+import pytest
+from unittest.mock import Mock, patch
+from mem0.llms.openai import OpenAILLM
+
+@pytest.fixture
+def mock_groq_client():
+    with patch('mem0.llms.openai.OpenAI') as mock_groq:
+        mock_client = Mock()
+        mock_groq.return_value = mock_client
+        yield mock_client
+
+
+def test_generate_response_without_tools(mock_groq_client):
+    llm = OpenAILLM()
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Hello, how are you?"}
+    ]
+    
+    mock_response = Mock()
+    mock_response.choices = [Mock(message=Mock(content="I'm doing well, thank you for asking!"))]
+    mock_groq_client.chat.completions.create.return_value = mock_response
+
+    response = llm.generate_response(messages)
+
+    mock_groq_client.chat.completions.create.assert_called_once_with(
+        model="gpt-4o",
+        messages=messages
+    )
+    assert response.choices[0].message.content == "I'm doing well, thank you for asking!"
+    
+
+def test_generate_response_with_tools(mock_groq_client):
+    llm = OpenAILLM()
+    messages = [
+        {"role": "system", "content": "You are a helpful assistant."},
+        {"role": "user", "content": "Add a new memory: Today is a sunny day."}
+    ]
+    tools = [
+        {
+            "type": "function",
+            "function": {
+                "name": "add_memory",
+                "description": "Add a memory",
+                "parameters": {
+                    "type": "object",
+                    "properties": {
+                        "data": {"type": "string", "description": "Data to add to memory"}
+                    },
+                    "required": ["data"],
+                },
+            },
+        }
+    ]
+    
+    mock_response = Mock()
+    mock_response.choices = [Mock(message=Mock(content="Memory added successfully."))]
+    mock_groq_client.chat.completions.create.return_value = mock_response
+
+    response = llm.generate_response(messages, tools=tools)
+
+    mock_groq_client.chat.completions.create.assert_called_once_with(
+        model="gpt-4o",
+        messages=messages,
+        tools=tools,
+        tool_choice="auto"
+    )
+    assert response.choices[0].message.content == "Memory added successfully."
+