Spaces:

ZoniaChatbot
/

ZoniaQwen

Sleeping

File size: 3,592 Bytes

8c4bdeb
7e2c92b
42eeb06
05e3b86
 
42eeb06
 
9d9ed2d
05e3b86
8c4bdeb
 
 
 
793c82d
8c4bdeb
ed8a94b
8c4bdeb
 
 
 
42eeb06
 
8c4bdeb
 
 
48f6eb4
 
1b7660d
8c4bdeb
 
2350b40
 
8c4bdeb
9d9ed2d
05e3b86
8c4bdeb
 
 
 
 
 
 
 
 
7e2c92b
8c4bdeb
47f9fc4
f58eae6
c7c4cf1
 
 
 
f58eae6
 
 
 
 
 
8c4bdeb
 
f58eae6
 
05e3b86
42eeb06
8c4bdeb
 
 
 
 
42eeb06
 
2350b40
42eeb06
 
8c4bdeb
e08b11d
7948ebe
f58eae6
8c4bdeb
f58eae6
 
8c4bdeb
 
 
2350b40
85f038b

import argparse
import os

import gradio as gr
from loguru import logger
from similarities import BertSimilarity, BM25Similarity

from chatpdf import Rag

pwd_path = os.path.abspath(os.path.dirname(__file__))

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument("--sim_model_name", type=str, default="shibing624/text2vec-base-multilingual")
    parser.add_argument("--gen_model_type", type=str, default="auto")
    parser.add_argument("--gen_model_name", type=str, default="Qwen/Qwen2-0.5B-Instruct")
    parser.add_argument("--lora_model", type=str, default=None)
    parser.add_argument("--rerank_model_name", type=str, default="")
    parser.add_argument("--corpus_files", type=str, default="Acuerdo009.pdf")
    parser.add_argument("--device", type=str, default=None)
    #parser.add_argument("--int4", action='store_true', help="use int4 quantization")
    #parser.add_argument("--int8", action='store_true', help="use int8 quantization")
    parser.add_argument("--chunk_size", type=int, default=220)
    parser.add_argument("--chunk_overlap", type=int, default=0)
    parser.add_argument("--num_expand_context_chunk", type=int, default=1)
    parser.add_argument("--server_name", type=str, default="0.0.0.0")
    parser.add_argument("--server_port", type=int, default=8082)
    parser.add_argument("--share", action='store_true', default=True, help="share model")
    args = parser.parse_args()
    logger.info(args)
    
    # Inicializar el modelo
    sim_model = BertSimilarity(model_name_or_path=args.sim_model_name, device=args.device)
    model = Rag(
        similarity_model=sim_model,
        generate_model_type=args.gen_model_type,
        generate_model_name_or_path=args.gen_model_name,
        lora_model_name_or_path=args.lora_model,
        corpus_files=args.corpus_files.split(','),
        device=args.device,
        chunk_size=args.chunk_size,
        chunk_overlap=args.chunk_overlap,
        num_expand_context_chunk=args.num_expand_context_chunk,
        rerank_model_name_or_path=args.rerank_model_name,
    )
    logger.info(f"chatpdf model: {model}")

    def predict_stream(message, history):
        history_format = []
        for human, assistant in history:
            history_format.append([human, assistant])
        model.history = history_format
        for chunk in model.predict_stream(message):
            yield chunk


    def predict(message, history):
        logger.debug(message)
        response, reference_results = model.predict(message)
        r = response + "\n\n" + '\n'.join(reference_results)
        logger.debug(r)
        return r


    chatbot_stream = gr.Chatbot(
        height=600,
        avatar_images=(
            os.path.join(pwd_path, "assets/user.png"),
            os.path.join(pwd_path, "assets/Logo1.png"),
        ), bubble_full_width=False)
    # Actualizar el título y la descripción
    title = " 🤖ChatPDF Zonia🤖 "
    # description = "Enlace en Github: [shibing624/ChatPDF](https://github.com/shibing624/ChatPDF)"
    css = """.toast-wrap { display: none !importante } """
    examples = ['Puede hablarme del PNL?', 'Introducción a la PNL']
    chat_interface_stream = gr.ChatInterface(
        predict,
        textbox=gr.Textbox(lines=4, placeholder="Ask me question", scale=7),  # Añadir submit=True
        title=title,
        # description=description,
        chatbot=chatbot_stream,
        css=css,
        examples=examples,
        theme='soft',
    )

    # Lanzar la aplicación sin `server_name` ni `server_port`
    chat_interface_stream.launch()