Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
@@ -117,16 +117,40 @@ st.markdown("""
|
|
117 |
|
118 |
if tabs == "Introduction":
|
119 |
st.write("### Introduction")
|
120 |
-
st.write("
|
|
|
|
|
|
|
|
|
|
|
|
|
121 |
|
122 |
elif tabs == "Analyse":
|
123 |
-
st.write("
|
124 |
-
|
125 |
st.dataframe(data.head(30))
|
126 |
st.write("")
|
127 |
-
|
|
|
|
|
|
|
|
|
128 |
repartition_par_categorie(st, data)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
129 |
repartition_longueur_categorie(st, data)
|
|
|
|
|
130 |
|
131 |
elif tabs == "Preprocessing":
|
132 |
detection_langage_et_traduction(st, extract_data, sum_data)
|
|
|
117 |
|
118 |
if tabs == "Introduction":
|
119 |
st.write("### Introduction")
|
120 |
+
st.write("""
|
121 |
+
Le catalogue de l’ecommerce Rakuten comporte des centaines de milliers d’articles mis à jour régulièrement. Le besoin de l’entreprise est de les classer automatiquement dans leur catégorie.
|
122 |
+
|
123 |
+
L’objectif de notre projet est de de prédire le code type d’un produit à partir de données textes décrivant des produits ainsi que leurs images associées.
|
124 |
+
|
125 |
+
Notre étude doit déterminer la qualité et la pertinence des données, d’évaluer un prétraitement possible et proposer une solution de classification l’exploitation de ces dernières
|
126 |
+
""")
|
127 |
|
128 |
elif tabs == "Analyse":
|
129 |
+
st.write("### Analyse")
|
130 |
+
st.write("Extrait de la base de données fournie par Rakuten:")
|
131 |
st.dataframe(data.head(30))
|
132 |
st.write("")
|
133 |
+
st.write("### Regard sur les données:")
|
134 |
+
st.write("")
|
135 |
+
st.write("")
|
136 |
+
st.write("Une distribution des observations par code produit non balancée:")
|
137 |
+
st.write("")
|
138 |
repartition_par_categorie(st, data)
|
139 |
+
st.write("")
|
140 |
+
st.divider()
|
141 |
+
st.write("")
|
142 |
+
st.write("### Variabilité de la taille des champs textes:")
|
143 |
+
st.write("")
|
144 |
+
st.text("""
|
145 |
+
Pourcentage de valeurs manquantes pour la description : 35.09%
|
146 |
+
Pourcentage de valeurs manquantes pour la designation : 0.00%
|
147 |
+
""")
|
148 |
+
|
149 |
+
st.write("")
|
150 |
+
st.write("")
|
151 |
repartition_longueur_categorie(st, data)
|
152 |
+
st.write("")
|
153 |
+
|
154 |
|
155 |
elif tabs == "Preprocessing":
|
156 |
detection_langage_et_traduction(st, extract_data, sum_data)
|