- Improvements to enable deployment in the cloud, mainly changing file access to Minio

- Improvements on RAG logging, and some debugging in that area
2024-08-01 17:35:54 +02:00
parent 88ca04136d
commit 64cf8df3a9
19 changed files with 617 additions and 206 deletions
--- a/eveai_chat_workers/tasks.py
+++ b/eveai_chat_workers/tasks.py
@@ -81,6 +81,12 @@ def ask_question(tenant_id, question, language, session_id, user_timezone):
                current_app.logger.error(f'ask_question: Error initializing chat session in database: {e}')
                raise

+        if tenant.rag_tuning:
+            current_app.rag_tuning_logger.debug(f'Received question for tenant {tenant_id}:\n{question}. Processing...')
+            current_app.rag_tuning_logger.debug(f'Tenant Information: \n{tenant.to_dict()}')
+            current_app.rag_tuning_logger.debug(f'===================================================================')
+            current_app.rag_tuning_logger.debug(f'===================================================================')
+
        result, interaction = answer_using_tenant_rag(question, language, tenant, chat_session)
        result['algorithm'] = current_app.config['INTERACTION_ALGORITHMS']['RAG_TENANT']['name']
        result['interaction_id'] = interaction.id
@@ -116,6 +122,9 @@ def answer_using_tenant_rag(question, language, tenant, chat_session):

    detailed_question = detail_question(question, language, model_variables, chat_session.session_id)
    current_app.logger.debug(f'Original question:\n {question}\n\nDetailed question: {detailed_question}')
+    if tenant.rag_tuning:
+        current_app.rag_tuning_logger.debug(f'Detailed Question for tenant {tenant.id}:\n{question}.')
+        current_app.rag_tuning_logger.debug(f'-------------------------------------------------------------------')
    new_interaction.detailed_question = detailed_question
    new_interaction.detailed_question_at = dt.now(tz.utc)

@@ -126,6 +135,9 @@ def answer_using_tenant_rag(question, language, tenant, chat_session):
    full_template = replace_variable_in_template(language_template, "{tenant_context}", model_variables['rag_context'])
    rag_prompt = ChatPromptTemplate.from_template(full_template)
    setup_and_retrieval = RunnableParallel({"context": retriever, "question": RunnablePassthrough()})
+    if tenant.rag_tuning:
+        current_app.rag_tuning_logger.debug(f'Full prompt for tenant {tenant.id}:\n{full_template}.')
+        current_app.rag_tuning_logger.debug(f'-------------------------------------------------------------------')

    new_interaction_embeddings = []
    if not model_variables['cited_answer_cls']:  # The model doesn't support structured feedback
@@ -151,6 +163,11 @@ def answer_using_tenant_rag(question, language, tenant, chat_session):
        current_app.logger.debug(f'ask_question: result answer: {result['answer']}')
        current_app.logger.debug(f'ask_question: result citations: {result["citations"]}')
        current_app.logger.debug(f'ask_question: insufficient information: {result["insufficient_info"]}')
+        if tenant.rag_tuning:
+            current_app.rag_tuning_logger.debug(f'ask_question: result answer: {result['answer']}')
+            current_app.rag_tuning_logger.debug(f'ask_question: result citations: {result["citations"]}')
+            current_app.rag_tuning_logger.debug(f'ask_question: insufficient information: {result["insufficient_info"]}')
+            current_app.rag_tuning_logger.debug(f'-------------------------------------------------------------------')
        new_interaction.answer = result['answer']

        # Filter out the existing Embedding IDs
@@ -161,7 +178,11 @@ def answer_using_tenant_rag(question, language, tenant, chat_session):
            .all()
        )
        existing_embedding_ids = [emb.id for emb in embeddings]
-        urls = [emb.document_version.url for emb in embeddings]
+        urls = list(set(emb.document_version.url for emb in embeddings))
+        if tenant.rag_tuning:
+            current_app.rag_tuning_logger.debug(f'Referenced documents for answer for tenant {tenant.id}:\n')
+            current_app.rag_tuning_logger.debug(f'{urls}')
+            current_app.rag_tuning_logger.debug(f'-------------------------------------------------------------------')

        for emb_id in existing_embedding_ids:
            new_interaction_embedding = InteractionEmbedding(embedding_id=emb_id)