Spaces:

GMARTINEZMILLA
/

Final_Project

Sleeping

App Files Files Community

mariaorri commited on Oct 23

Commit

ee5a880

•

1 Parent(s): f25f15d

Update utils.py

Browse files

Borrado funciones comentadas y cambio en recomienda para mostrar solo las primeras 5 recomendaciones.

Files changed (1) hide show

utils.py +1 -52

utils.py CHANGED Viewed

@@ -57,7 +57,7 @@ def recomienda_tf(new_basket, cestas, productos):
             })
     recommendations_df = pd.DataFrame(recommendations_data)
-    return recommendations_df
 def retroalimentacion(cestas, cesta_nueva):
     # Pasamos de lista a cadena de texto
@@ -88,54 +88,3 @@ def retroalimentacion(cestas, cesta_nueva):
     return None
-# def recomienda_tf(new_basket,cestas,productos):
-#     # Cargar la matriz TF y el modelo
-#     tf_matrix = load('tf_matrix.joblib')
-#     count = load('count_vectorizer.joblib')
-#     # Convertir la nueva cesta en formato TF (Term Frequency)
-#     new_basket_str = ' '.join(new_basket)
-#     new_basket_vector = count.transform([new_basket_str])
-#     new_basket_tf = normalize(new_basket_vector, norm='l1')  # Normalizamos la matriz count de la cesta actual
-#     # Comparar la nueva cesta con las anteriores
-#     similarities = cosine_similarity(new_basket_tf, tf_matrix)
-#     # Obtener los índices de las cestas más similares
-#     similar_indices = similarities.argsort()[0][-4:]  # Las 4 más similares
-#     # Crear un diccionario para contar las recomendaciones
-#     recommendations_count = {}
-#     total_similarity = 0
-#     # Recomendar productos de cestas similares
-#     for idx in similar_indices:
-#         sim_score = similarities[0][idx]
-#         total_similarity += sim_score  # Suma de las similitudes
-#         products = cestas.iloc[idx]['Cestas'].split()
-#         # Usar un conjunto para evitar contar productos múltiples veces en la misma cesta
-#         unique_products = set(products)  # Usar un conjunto para obtener productos únicos
-#         # Con esto evitamos que la importancia crezca por las unidades
-#         for product in unique_products:
-#             if product.strip() not in new_basket:  # Evitar recomendar lo que ya está en la cesta
-#                 recommendations_count[product.strip()] = recommendations_count.get(product.strip(), 0) + sim_score
-#                 # Almacena el conteo de la relevancia de cada producto basado en cuántas veces aparece en las cestas similares, ponderado por la similitud de cada cesta.
-#     # Calcular la probabilidad relativa de cada producto recomendado
-#     recommendations_with_prob = []
-#     if total_similarity > 0:  # Verificar que total_similarity no sea cero
-#         recommendations_with_prob = [(product, score / total_similarity) for product, score in recommendations_count.items()]
-#     else:
-#         print("No se encontraron similitudes suficientes para calcular probabilidades.")
-#     recommendations_with_prob.sort(key=lambda x: x[1], reverse=True)  # Ordenar por puntuación
-#     # Crear un nuevo DataFrame para almacenar las recomendaciones
-#     recommendations_data = []
-#     for product, score in recommendations_with_prob:
-#         # Buscar la descripción en el DataFrame de productos
-#         description = productos.loc[productos['ARTICULO'] == product, 'DESCRIPCION']
-#         if not description.empty:
-#             recommendations_data.append({
-#                 'ARTICULO': product,
-#                 'DESCRIPCION': description.values[0],  # Obtener el primer valor encontrado
-#                 'RELEVANCIA': score
-#             })
-#     recommendations_df = pd.DataFrame(recommendations_data)
-#     return recommendations_df

             })
     recommendations_df = pd.DataFrame(recommendations_data)
+    return recommendations_df.head(5)
 def retroalimentacion(cestas, cesta_nueva):
     # Pasamos de lista a cadena de texto
     return None