Spaces:

lilmeaty
/

vllmxd

Runtime error

Hjgugugjhuhjggg commited on 3 days ago

Commit

c696739

•

1 Parent(s): c6ab5e0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -21,10 +21,7 @@ nltk.download('stopwords')
 app = FastAPI()
-if torch.cuda.is_available():
-    device = torch.device("cuda")
-else:
-    device = torch.device("cpu")
 modelos = {
     "gpt2-medium": VLLM(model="gpt2-medium", device=device),
@@ -38,8 +35,8 @@ caches = {
 }
 cadenas = {
-    nombre: LLMChain(modelo, cache)
-    for nombre, modelo, cache in zip(modelos.keys(), modelos.values(), caches.values())
 }
 summarizer = pipeline("summarization", device=device)
@@ -52,6 +49,7 @@ def keep_alive():
                 cadena.ask("¿Cuál es el sentido de la vida?")
             except Exception as e:
                 logging.error(f"Error en modelo {cadena}: {e}")
         time.sleep(300)
 def liberar_recursos():
@@ -65,7 +63,6 @@ def liberar_recursos():
                     os.kill(proc.info['pid'], 9)
         time.sleep(60)
-# Iniciar hilos en segundo plano
 threading.Thread(target=keep_alive, daemon=True).start()
 threading.Thread(target=liberar_recursos, daemon=True).start()

 app = FastAPI()
+device = torch.device("cpu")
 modelos = {
     "gpt2-medium": VLLM(model="gpt2-medium", device=device),
 }
 cadenas = {
+    nombre: LLMChain(modelo, caché)
+    for nombre, modelo, caché in zip(modelos.keys(), modelos.values(), caches.values())
 }
 summarizer = pipeline("summarization", device=device)
                 cadena.ask("¿Cuál es el sentido de la vida?")
             except Exception as e:
                 logging.error(f"Error en modelo {cadena}: {e}")
+                cadenas.pop(cadena)
         time.sleep(300)
 def liberar_recursos():
                     os.kill(proc.info['pid'], 9)
         time.sleep(60)
 threading.Thread(target=keep_alive, daemon=True).start()
 threading.Thread(target=liberar_recursos, daemon=True).start()