import gradio as gr from huggingface_hub import InferenceClient import os from transformers import pipeline import numpy as np from model import SAMPLING_RATE, FEATURE_EXTRACTOR # modelo = "mixed-data" modelo = "cry-detector" pipe = pipeline( "audio-classification", model=f"distilhubert-finetuned-{modelo}", feature_extractor=FEATURE_EXTRACTOR, device="cuda", ) token = os.getenv('HF_TOKEN') # client = InferenceClient("meta-llama/Meta-Llama-3-8B-Instruct", token=token) client = InferenceClient("mistralai/Mistral-Nemo-Instruct-2407", token=token) def respond( message, history: list[tuple[str, str]], system_message, max_tokens, temperature, top_p, ): messages = [{"role": "system", "content": system_message}] for val in history: if val[0]: messages.append({"role": "user", "content": val[0]}) if val[1]: messages.append({"role": "assistant", "content": val[1]}) messages.append({"role": "user", "content": message}) response = "" for message in client.chat_completion( messages, max_tokens=max_tokens, stream=True, temperature=temperature, top_p=top_p, ): token = message.choices[0].delta.content response += token yield response my_theme = gr.themes.Soft( primary_hue="emerald", secondary_hue="green", neutral_hue="slate", text_size="sm", spacing_size="sm", font=[gr.themes.GoogleFont('Nunito'), 'ui-sans-serif', 'system-ui', 'sans-serif'], font_mono=[gr.themes.GoogleFont('Nunito'), 'ui-monospace', 'Consolas', 'monospace'], ).set( body_background_fill='*neutral_50', body_text_color='*neutral_600', body_text_size='*text_sm', embed_radius='*radius_md', shadow_drop='*shadow_spread', shadow_spread='*button_shadow_active' ) def mostrar_pagina_1(): return gr.update(visible=False), gr.update(visible=True) def mostrar_pagina_2(): return gr.update(visible=False), gr.update(visible=True) def redirigir_a_pantalla_inicial(): return gr.update(visible=True), gr.update(visible=False) def transcribe(audio): _, y = audio y = y.astype(np.float32) # con torch.float32 da error y /= np.max(np.abs(y)) results = pipe({"sampling_rate": SAMPLING_RATE, "raw": y}) top_result = results[0] # Get the top result (most likely classification) label = top_result["label"] # Extract the label from the top result return label with gr.Blocks(theme=my_theme) as demo: with gr.Column(visible=True, elem_id="pantalla-inicial") as pantalla_inicial: gr.HTML( """
Iremia es un proyecto llevado a cabo por un grupo de estudiantes interesados en el desarrollo de modelos de inteligencia artificial, enfocados específicamente en casos de uso relevantes para ayudar a cuidar a los más pequeños de la casa.
" ) gr.Markdown( "Sabemos que la paternidad puede suponer un gran desafío. Nuestra misión es brindarles a todos los padres unas herramientas de última tecnología que los ayuden a navegar esos primeros meses de vida tan cruciales en el desarrollo de sus pequeños.
" ) gr.Markdown( "Iremia ofrece dos funcionalidades muy interesantes:
" ) gr.Markdown( "Predictor: Con nuestro modelo de inteligencia artificial, somos capaces de predecir por qué tu hijo de menos de 2 años está llorando. Además, tendrás acceso a un asistente personal para consultar cualquier duda que tengas sobre el cuidado de tu pequeño.
" ) gr.Markdown( "Monitor: Nuestro monitor no es como otros que hay en el mercado, ya que es capaz de reconocer si un sonido es un llanto del bebé o no, y si está llorando, predice automáticamente la causa, lo cual te brindará la tranquilidad de saber siempre qué pasa con tu pequeño y te ahorrará tiempo y muchas horas de sueño.
" ) with gr.Row(): with gr.Column(): gr.Markdown("Descubre por qué llora tu bebé y resuelve dudas sobre su cuidado con nuestro Iremia assistant
") with gr.Column(): gr.Markdown("Un monitor inteligente que detecta si tu hijo está llorando y te indica el motivo antes de que puedas levantarte del sofá
") with gr.Column(visible=False) as pagina_1: with gr.Row(): with gr.Column(): gr.Markdown("