Enable model variables & start working on RAG task

2024-05-25 20:17:02 +02:00
parent e483d6cf90
commit ce91323dc9
15 changed files with 340 additions and 46 deletions
--- a/common/models/user.py
+++ b/common/models/user.py
@@ -2,6 +2,7 @@ from common.extensions import db
 from flask_security import UserMixin, RoleMixin
 from sqlalchemy.dialects.postgresql import ARRAY
 import sqlalchemy as sa
 from sqlalchemy import CheckConstraint
 class Tenant(db.Model):
@@ -33,6 +34,14 @@ class Tenant(db.Model):
    html_included_elements = db.Column(ARRAY(sa.String(50)), nullable=True)
    html_excluded_elements = db.Column(ARRAY(sa.String(50)), nullable=True)
    # Embedding search variables
    es_k = db.Column(db.Integer, nullable=True, default=5)
    es_similarity_threshold = db.Column(db.Float, nullable=True, default=0.7)
    # Chat variables
    chat_RAG_temperature = db.Column(db.Float, nullable=True, default=0.3)
    chat_no_RAG_temperature = db.Column(db.Float, nullable=True, default=0.5)
    # Licensing Information
    license_start_date = db.Column(db.Date, nullable=True)
    license_end_date = db.Column(db.Date, nullable=True)
--- a/common/utils/celery_utils.py
+++ b/common/utils/celery_utils.py
@@ -7,6 +7,8 @@ celery_app = Celery()
 def init_celery(celery, app):
    celery_app.main = app.name
    app.logger.debug(f'CELERY_BROKER_URL: {app.config["CELERY_BROKER_URL"]}')
    app.logger.debug(f'CELERY_RESULT_BACKEND: {app.config["CELERY_RESULT_BACKEND"]}')
    celery_config = {
        'broker_url': app.config.get('CELERY_BROKER_URL', 'redis://localhost:6379/0'),
        'result_backend': app.config.get('CELERY_RESULT_BACKEND', 'redis://localhost:6379/0'),
--- a/config/config.py
+++ b/config/config.py
@@ -1,5 +1,6 @@
 from os import environ, path
 from datetime import timedelta
 import redis
 basedir = path.abspath(path.dirname(__file__))
@@ -42,7 +43,7 @@ class Config(object):
    # supported LLMs
    SUPPORTED_EMBEDDINGS = ['openai.text-embedding-3-small', 'mistral.mistral-embed']
-    SUPPORTED_LLMS = ['openai.gpt-4-turbo', 'openai.gpt-3.5-turbo', 'mistral.mistral-large-2402']
+    SUPPORTED_LLMS = ['openai.gpt-4o', 'openai.gpt-4-turbo', 'openai.gpt-3.5-turbo', 'mistral.mistral-large-2402']
    # Celery settings
    CELERY_TASK_SERIALIZER = 'json'
@@ -62,6 +63,20 @@ class Config(object):
    GPT3_5_SUMMARY_TEMPLATE = """Write a concise summary of the text in the same language as the provided text. 
        Text is delimited between triple backquotes.
        ```{text}```"""
    GPT4_RAG_TEMPLATE = """Answer the question based on the following context, both delimited between triple backquotes
    in the same language as question. 
    If the question cannot be answered using the text, say "I don't know" in the same language as the question.
    Context:
    ```{context}```
    Question:
    ```{question}```"""
    GPT3_5_RAG_TEMPLATE = """Answer the question based on the following context, both delimited between triple backquotes
        in the same language as question. 
        If the question cannot be answered using the text, say "I don't know" in the same language as the question.
        Context:
        ```{context}```
        Question:
        ```{question}```"""
    # SocketIO settings
    # SOCKETIO_ASYNC_MODE = 'threading'
@@ -91,8 +106,13 @@ class DevConfig(Config):
    UPLOAD_FOLDER = '/Volumes/OWC4M2_1/Development/eveAI/file_store'
    # Celery settings
-    CELERY_BROKER_URL = 'redis://localhost:6379/0'  # Default Redis configuration
+    # eveai_app Redis Settings
    CELERY_BROKER_URL = 'redis://localhost:6379/0'
    CELERY_RESULT_BACKEND = 'redis://localhost:6379/0'
    # eveai_chat Redis Settings
    CELERY_BROKER_URL_CHAT = 'redis://localhost:6379/3'
    CELERY_RESULT_BACKEND_CHAT = 'redis://localhost:6379/3'
    # OpenAI API Keys
    OPENAI_API_KEY = 'sk-proj-8R0jWzwjL7PeoPyMhJTZT3BlbkFJLb6HfRB2Hr9cEVFWEhU7'
@@ -118,12 +138,8 @@ class DevConfig(Config):
    JWT_SECRET_KEY = 'bsdMkmQ8ObfMD52yAFg4trrvjgjMhuIqg2fjDpD/JqvgY0ccCcmlsEnVFmR79WPiLKEA3i8a5zmejwLZKl4v9Q=='
    # Session settings
-    SESSION_REDIS = {
+    SESSION_REDIS = redis.from_url('redis://localhost:6379/2')
-        'host': 'localhost',  # Redis server hostname or IP address
+
        'port': 6379,  # Redis server port
        'db': 2,  # Redis database number (optional)
        'password': None  # Redis password (optional)
    }
 class ProdConfig(Config):
    DEVELOPMENT = False
--- a/config/logging_config.py
+++ b/config/logging_config.py
@@ -26,6 +26,14 @@ LOGGING = {
            'backupCount': 10,
            'formatter': 'standard',
        },
        'file_chat_workers': {
            'level': 'DEBUG',
            'class': 'logging.handlers.RotatingFileHandler',
            'filename': 'logs/eveai_chat_workers.log',
            'maxBytes': 1024*1024*5,  # 5MB
            'backupCount': 10,
            'formatter': 'standard',
        },
        'console': {
            'class': 'logging.StreamHandler',
            'level': 'DEBUG',
@@ -53,6 +61,11 @@ LOGGING = {
            'level': 'DEBUG',
            'propagate': False
        },
        'eveai_chat_workers': {  # logger for the eveai_chat_workers
            'handlers': ['file_chat_workers', 'console'],
            'level': 'DEBUG',
            'propagate': False
        },
        '': {  # root logger
            'handlers': ['console'],
            'level': 'WARNING',  # Set higher level for root to minimize noise
--- a/eveai_app/templates/user/tenant_overview.html
+++ b/eveai_app/templates/user/tenant_overview.html
@@ -35,6 +35,11 @@
                                HTML Chunking
                            </a>
                        </li>
                        <li class="nav-item">
                            <a class="nav-link mb-0 px-0 py-1" data-toggle="tab" href="#embedding-search-tab" role="tab" aria-controls="html-chunking" aria-selected="false">
                                Embedding Search
                            </a>
                        </li>
                        <li class="nav-item">
                            <a class="nav-link mb-0 px-0 py-1" data-toggle="tab" href="#domains-tab" role="tab" aria-controls="domains" aria-selected="false">
                                Domains
@@ -71,6 +76,14 @@
                            {{ render_included_field(field, disabled_fields=html_fields, include_fields=html_fields) }}
                        {% endfor %}
                    </div>
                    <!-- Embedding Search Settings Tab -->
                    <div class="tab-pane fade" id="embedding-search-tab" role="tabpanel">
                        {% set es_fields = ['es_k', 'es_similarity_threshold', ] %}
                        {% for field in form %}
                            {{ render_included_field(field, disabled_fields=es_fields, include_fields=es_fields) }}
                        {% endfor %}
                    </div>
                    <!-- Domains Tab -->
                    <div class="tab-pane fade" id="domains-tab" role="tabpanel">
                        <ul>
--- a/eveai_app/views/user_forms.py
+++ b/eveai_app/views/user_forms.py
@@ -1,7 +1,7 @@
 from flask import current_app
 from flask_wtf import FlaskForm
 from wtforms import (StringField, PasswordField, BooleanField, SubmitField, EmailField, IntegerField, DateField,
-                     SelectField, SelectMultipleField, FieldList, FormField)
+                     SelectField, SelectMultipleField, FieldList, FormField, FloatField)
 from wtforms.validators import DataRequired, Length, Email, NumberRange, Optional
 from common.models.user import Role
@@ -26,6 +26,10 @@ class TenantForm(FlaskForm):
                                default='p, li')
    html_included_elements = StringField('HTML Included Elements', validators=[Optional()])
    html_excluded_elements = StringField('HTML Excluded Elements', validators=[Optional()])
    # Embedding Search variables
    es_k = IntegerField('Limit for Searching Embeddings (5)', validators=[NumberRange(min=0)])
    es_similarity_threshold = FloatField('Similarity Threshold for Searching Embeddings (0.5)',
                                         validators=[NumberRange(min=0, max=1)])
    submit = SubmitField('Submit')
--- a/eveai_chat/init.py
+++ b/eveai_chat/init.py
@@ -7,6 +7,9 @@ from common.extensions import db, socketio, jwt, kms_client, cors, session
 from config.logging_config import LOGGING
 from eveai_chat.socket_handlers import chat_handler
 from common.utils.cors_utils import create_cors_after_request
 from common.utils.celery_utils import make_celery, init_celery
 def create_app(config_file=None):
@@ -20,6 +23,9 @@ def create_app(config_file=None):
    logging.config.dictConfig(LOGGING)
    register_extensions(app)
    app.celery = make_celery(app.name, app.config)
    init_celery(app.celery, app)
    # Register Blueprints
    register_blueprints(app)
@@ -49,13 +55,6 @@ def register_extensions(app):
    cors.init_app(app, resources={r"/chat/*": {"origins": "*"}})
    app.after_request(create_cors_after_request('/chat'))
    # Session setup
    # redis_config = app.config['SESSION_REDIS']
    # redis_client = Redis(host=redis_config['host'],
    #                      port=redis_config['port'],
    #                      db=redis_config['db'],
    #                      password=redis_config['password']
    #                      )
    session.init_app(app)
--- a/eveai_chat/socket_handlers/chat_handler.py
+++ b/eveai_chat/socket_handlers/chat_handler.py
@@ -4,6 +4,7 @@ from flask import current_app, request
 from common.extensions import socketio, kms_client
 from common.models.user import Tenant
 from common.utils.celery_utils import current_celery
@socketio.on('connect')
@@ -66,13 +67,17 @@ def handle_message(data):
        if not current_api_key:
            raise Exception("Missing api_key")
-        # Store interaction in the database
+        # Offload actual processing of question
-
+        task = current_celery.send_task('ask_question', queue='llm_interactions', args=[
            current_tenant_id,
            data['message'],
        ])
        current_app.logger.debug(f'SocketIO: Message offloading for tenant {current_tenant_id}, '
                                 f'Question: {task.id}')
        response = {
            'tenantId': data['tenantId'],
-            'message': f'This is a bot response. Responding to message {data['message']} '
+            'message': 'Processing question ...',
-                       f'from tenant {current_tenant_id}',
+            'taskId': task.id,
            'messageId': 'bot-message-id',
            'algorithm': 'alg1'
        }
        current_app.logger.debug(f"SocketIO: Message handling sent bot response: {response}")
@@ -82,6 +87,30 @@ def handle_message(data):
        disconnect()
@socketio.on('check_task_status')
 def check_task_status(data):
    task_id = data.get('task_id')
    current_app.logger.debug(f'SocketIO: Check task status for task_id: {task_id}')
    if not task_id:
        emit('task_status', {'status': 'error', 'message': 'Missing task ID'})
        return
    task_result = current_celery.AsyncResult(task_id)
    if task_result.state == 'PENDING':
        current_app.logger.debug(f'SocketIO: Task {task_id} is pending')
        emit('task_status', {'status': 'pending', 'taskId': task_id})
    elif task_result.state != 'FAILURE':
        current_app.logger.debug(f'SocketIO: Task {task_id} has finished. Status: {task_result.state}, '
                                 f'Result: {task_result.result}')
        emit('task_status', {
            'status': task_result.state,
            'result': task_result.result
        })
    else:
        current_app.logger.error(f'SocketIO: Task {task_id} has failed. Error: {task_result.info}')
        emit('task_status', {'status': 'failure', 'message': str(task_result.info)})
 def validate_api_key(tenant_id, api_key):
    tenant = Tenant.query.get_or_404(tenant_id)
    decrypted_api_key = kms_client.decrypt_api_key(tenant.encrypted_chat_api_key)
--- a/eveai_chat_workers/init.py
+++ b/eveai_chat_workers/init.py
@@ -0,0 +1,36 @@
 import logging
 import logging.config
 from flask import Flask
 from common.utils.celery_utils import make_celery, init_celery
 from common.extensions import db
 from config.logging_config import LOGGING
 def create_app(config_file=None):
    app = Flask(__name__)
    if config_file is None:
        app.config.from_object('config.config.DevConfig')
    else:
        app.config.from_object(config_file)
    logging.config.dictConfig(LOGGING)
    app.logger.debug('Starting up eveai_chat_workers...')
    register_extensions(app)
    celery = make_celery(app.name, app.config)
    init_celery(celery, app)
    from eveai_chat_workers import tasks
    print(tasks.tasks_ping())
    return app, celery
 def register_extensions(app):
    db.init_app(app)
 app, celery = create_app()
--- a/eveai_chat_workers/tasks.py
+++ b/eveai_chat_workers/tasks.py
@@ -0,0 +1,158 @@
 from datetime import datetime as dt, timezone as tz
 from flask import current_app
 from sqlalchemy.exc import SQLAlchemyError
 from celery import states
 from celery.exceptions import Ignore
 import os
 # Unstructured commercial client imports
 from unstructured_client import UnstructuredClient
 from unstructured_client.models import shared
 from unstructured_client.models.errors import SDKError
 # OpenAI imports
 from langchain_openai import OpenAIEmbeddings, ChatOpenAI
 from langchain_core.prompts import ChatPromptTemplate
 from langchain.chains.summarize import load_summarize_chain
 from langchain.text_splitter import CharacterTextSplitter
 from langchain_core.exceptions import LangChainException
 from common.utils.database import Database
 from common.models.document import DocumentVersion, EmbeddingMistral, EmbeddingSmallOpenAI
 from common.models.user import Tenant
 from common.extensions import db
 from common.utils.celery_utils import current_celery
 from bs4 import BeautifulSoup
@current_celery.task(name='ask_question', queue='llm_interactions')
 def ask_question(tenant_id, question):
    current_app.logger.debug('In ask_question')
    current_app.logger.debug(f'ask_question: Received question for tenant {tenant_id}: {question}. Processing...')
    try:
        # Retrieve the tenant
        tenant = Tenant.query.get(tenant_id)
        if not tenant:
            raise Exception(f'Tenant {tenant_id} not found.')
        # Ensure we are working in the correct database schema
        Database(tenant_id).switch_schema()
        # Select variables to work with depending on tenant model
        model_variables = select_model_variables(tenant)
        # create embedding for the query
        embedded_question = create_embedding(model_variables, question)
        # Search the database for relevant embeddings
        relevant_embeddings = search_embeddings(model_variables, embedded_question)
        response = ""
        for embed in relevant_embeddings:
            response += relevant_embeddings.chunk + '\n'
        return response
    except Exception as e:
        current_app.logger.error(f'ask_question: Error processing question: {e}')
        raise Ignore
 def select_model_variables(tenant):
    embedding_provider = tenant.embedding_model.rsplit('.', 1)[0]
    embedding_model = tenant.embedding_model.rsplit('.', 1)[1]
    llm_provider = tenant.llm_model.rsplit('.', 1)[0]
    llm_model = tenant.llm_model.rsplit('.', 1)[1]
    # Set model variables
    model_variables = {}
    if tenant.es_k:
        model_variables['k'] = tenant.es_k
    else:
        model_variables['k'] = 5
    if tenant.es_similarity_threshold:
        model_variables['similarity_threshold'] = tenant.es_similarity_threshold
    else:
        model_variables['similarity_threshold'] = 0.7
    if tenant.chat_RAG_temperature:
        model_variables['RAG_temperature'] = tenant.chat_RAG_temperature
    else:
        model_variables['RAG_temperature'] = 0.3
    if tenant.chat_no_RAG_temperature:
        model_variables['no_RAG_temperature'] = tenant.chat_no_RAG_temperature
    else:
        model_variables['no_RAG_temperature'] = 0.5
    # Set Embedding variables
    match embedding_provider:
        case 'openai':
            match embedding_model:
                case 'text-embedding-3-small':
                    api_key = current_app.config.get('OPENAI_API_KEY')
                    model_variables['embedding'] = OpenAIEmbeddings(api_key=api_key,
                                                                    model='text-embedding-3-small')
                    model_variables['embedding_db_model'] = EmbeddingSmallOpenAI
                case _:
                    raise Exception(f'Error setting model variables for tenant {tenant.id} '
                                    f'error: Invalid embedding model')
        case _:
            raise Exception(f'Error setting model variables for tenant {tenant.id} '
                            f'error: Invalid embedding provider')
    # Set Chat model variables
    match llm_provider:
        case 'openai':
            api_key = current_app.config.get('OPENAI_API_KEY')
            model_variables['llm'] = ChatOpenAI(api_key=api_key,
                                                model=llm_model,
                                                temperature=model_variables['RAG_temperature'])
            match llm_model:
                case 'gpt-4-turbo' | 'gpt-4-o':
                    rag_template = current_app.config.get('GPT4_RAG_TEMPLATE')
                case 'gpt-3-5-turbo':
                    rag_template = current_app.config.get('GPT3_5_RAG_TEMPLATE')
                case _:
                    raise Exception(f'Error setting model variables for tenant {tenant.id} '
                                    f'error: Invalid chat model')
            model_variables['prompt'] = ChatPromptTemplate.from_template(rag_template)
        case _:
            raise Exception(f'Error setting model variables for tenant {tenant.id} '
                            f'error: Invalid chat provider')
    return model_variables
 def create_embedding(model_variables, question):
    try:
        embeddings = model_variables['embedding'].embed_documents(question)
    except LangChainException as e:
        raise Exception(f'Error creating embedding for question (LangChain): {e}')
    return embeddings[0]
 def search_embeddings(model_variables, embedded_query):
    current_app.logger.debug(f'In search_embeddings searching for {embedded_query}')
    db_class = model_variables['embedding_db_model']
    try:
        res = (
            db.session.query(db_class, db_class.embedding.cosine_distance(embedded_query).label('distance'))
            .filter(db_class.embedding.cosine_distance(embedded_query) < model_variables['similarity_threshold'])
            .order_by("distance")
            .limit(model_variables['k'])
            .all()
        )
    except SQLAlchemyError as e:
        raise Exception(f'Error searching embeddings (SQLAlchemy): {e}')
    current_app.logger.debug(f'Results from embedding search: {res}')
    return res
 def tasks_ping():
    return 'pong'
--- a/eveai_workers/celery_utils.py
+++ b/eveai_workers/celery_utils.py
@@ -1,23 +0,0 @@
 from .tasks import create_embeddings
 from celery import Celery, Task
 def init_celery(app):
    class ContextTask(Task):
        def __call__(self, *args, **kwargs):
            with app.app_context():
                return self.run(*args, **kwargs)
    celery_app = Celery(app.import_name, task_cls=ContextTask)
    celery_app.conf.broker_url = app.config.get('CELERY_BROKER_URL')
    celery_app.conf.result_backend = app.config.get('CELERY_RESULT_BACKEND')
    celery_app.conf.accept_content = app.config.get('CELERY_ACCEPT_CONTENT')
    celery_app.conf.task_serializer = app.config.get('CELERY_TASK_SERIALIZER')
    celery_app.conf.timezone = app.config.get('CELERY_TIMEZONE')
    celery_app.conf.enable_utc = app.config.get('CELERY_ENABLE_UTC')
    celery_app.set_default()
    app.extensions['celery'] = celery_app
--- a/scripts/run_eveai_chat_workers.py
+++ b/scripts/run_eveai_chat_workers.py
@@ -0,0 +1,4 @@
 from eveai_chat_workers import celery
 if __name__ == '__main__':
    celery.start()
--- a/scripts/start_eveai_chat_workers.sh
+++ b/scripts/start_eveai_chat_workers.sh
@@ -0,0 +1,13 @@
 #!/usr/bin/env bash
 cd "/Volumes/OWC4M2_1/Dropbox/Josako's Dev/Josako/EveAI/Development/eveAI/" || exit 1
 source "/Volumes/OWC4M2_1/Dropbox/Josako's Dev/Josako/EveAI/Development/eveAI/.venv/bin/activate"
 export PYTHONPATH="$PYTHONPATH:/Volumes/OWC4M2_1/Dropbox/Josako's Dev/Josako/EveAI/Development/eveAI/"
 # Start a worker for the 'llm_interactions' queue with auto-scaling
 celery -A eveai_chat_workers.celery worker --loglevel=info -Q llm_interactions --autoscale=2,8 --hostname=interactions_worker@%h &
 # Wait for all background processes to finish
 wait
 deactivate
--- a/scripts/start_eveai_workers.sh
+++ b/scripts/start_eveai_workers.sh
@@ -6,8 +6,8 @@ source "/Volumes/OWC4M2_1/Dropbox/Josako's Dev/Josako/EveAI/Development/eveAI/.v
 # Start a worker for the 'embeddings' queue with higher concurrency
 celery -A eveai_workers.celery worker --loglevel=info -Q embeddings --autoscale=1,4 --hostname=embeddings_worker@%h &
-# Start a worker for the 'llm_interactions' queue with auto-scaling
+# Start a worker for the 'llm_interactions' queue with auto-scaling - not necessary, in eveai_chat_workers
-celery -A eveai_workers.celery worker --loglevel=info - Q llm_interactions --autoscale=2,8 --hostname=interactions_worker@%h &
+# celery -A eveai_workers.celery worker --loglevel=info - Q llm_interactions --autoscale=2,8 --hostname=interactions_worker@%h &
 # Wait for all background processes to finish
 wait
--- a/static/js/eveai-chat-widget.js
+++ b/static/js/eveai-chat-widget.js
@@ -114,9 +114,30 @@ class EveAIChatWidget extends HTMLElement {
    this.socket.on('bot_response', (data) => {
      if (data.tenantId === this.tenantId) {
        console.log('Bot response received:', data)
        console.log('Task ID received:', data.taskId)
        this.addMessage(data.message, 'bot', data.messageId, data.algorithm);
        this.checkTaskStatus(data.taskId)
      }
    });
    this.socket.on('task_status', (data) => {
      console.log('Task status received:', data)
      console.log('Task ID received:', data.taskId)
      if (data.status === 'SUCCESS') {
        this.addMessage(data.result, 'bot');
      } else if (data.status === 'FAILURE') {
        this.addMessage('Failed to process message.', 'bot');
      } else if (data.status === 'pending') {
        console.log('Task is pending')
        setTimeout(() => this.checkTaskStatus(data.taskId), 1000); // Poll every second
        console.log('New check sent')
      }
    });
  }
  checkTaskStatus(taskId) {
      this.socket.emit('check_task_status', { task_id: taskId });
  }
  getTemplate() {