jpgallegoar/F5-Spanish · no se le entiende

22 days ago

comete demasiados errores de diccion y cuando le bajas la velocidad , con la que debe hablar ahi ya no se le entiende nada

jpgallegoar

Owner 22 days ago

estás utilizando el espacio de huggingface? https://huggingface.co/spaces/jpgallegoar/Spanish-F5

KairosArg

22 days ago

si https://huggingface.co/spaces/jpgallegoar/Spanish-F5 y no se le entiende nada su queres te envio un audio

Chris-McXavier

19 days ago

•

edited 19 days ago

Me pasó lo mismo, pero porque la persona del audio hablaba demasiado rápido/no vocalizaba demasiado claro, pero con audios claros y bien vocalizados se arregla en gran medida. Causó que, en los audios generados, la IA se saltara palabras o las repetía. Es más común que me pase si el audio original tiene más silencios, y empeora significativamente bajando la velocidad. 🤔

Como input, el texto fue "Teorías de skibidi toilet. En el episodio trece podemos ver que, este es el único que puede lanzar rayos además de giman. O sea, yo digo que es su hijo... Pues, yo creo eso."

jpgallegoar

Owner 18 days ago

Sí, el modelo no se adapta bien al slider de velocidad ni a voces extrañas. La mejor opción si de verdad quieres esa voz es reducirle la velocidad de otra forma antes de subirlo al F5

KairosArg

17 days ago

•

edited 17 days ago

no es voz extraña la que subi y es bien clara , a demas le pone acento chileno - y el multiabla directamente da error.

Escucha, o buscador, estas canciones de experiencia,
nacidas de la realización directa:
En la casa de la confusión
la mente vaga como un ciego.
Atada por las cuerdas de los conceptos,
danza en el teatro de sus propias proyecciones.
¡Oh, qué maravilla!

jpgallegoar

Owner 17 days ago

Ni siquiera te has dignado a leer las instrucciones:
"
Para los mejores resultados, intenta convertir tu audio de referencia a WAV o MP3, asegurarte de que duren entre 11 y 14 segundos, que comiencen y acaben con entre medio segundo y un segundo de silencio, y a ser posible que acabe con el final de la frase.
"

Desde ya me di cuenta que tu audio termina en la mitad de una palabra. Con respecto al acento, mientras más información de fonemas incluya tu audio de entrada, más sabe el modelo.

KairosArg

17 days ago

el audio que te mande es el resultado no la voz original,

KairosArg changed discussion status to closed 17 days ago

KairosArg

17 days ago

da error para cargar el audio original pero dura 13 segundos

KairosArg changed discussion status to open 17 days ago

jpgallegoar

Owner 17 days ago

Si, ya se que es el resultado. Escuchando los errores sé que tu audio original está mal de alguna forma u otra. Subelo aqui y me mandas el link https://vocaroo.com/

nicogiarru

16 days ago

Hola! Gracias desde ya por el trabajo hecho, estoy teniendo problemas tambien para generar el audio, la voz la copia perfecto pero dice cosas extrañas que no son ni pablabras, subi wav de 8 seg con silencios al incicio y al final, sera que tengo mal algun archivo? busco acento argentino, lo poco que s ele llega a entender es con tono español, gracias por la ayuda!! (adjunto audio de original)

jpgallegoar

Owner 16 days ago

•

edited 16 days ago

Hola! Gracias desde ya por el trabajo hecho, estoy teniendo problemas tambien para generar el audio, la voz la copia perfecto pero dice cosas extrañas que no son ni pablabras, subi wav de 8 seg con silencios al incicio y al final, sera que tengo mal algun archivo? busco acento argentino, lo poco que s ele llega a entender es con tono español, gracias por la ayuda!! (adjunto audio de original)

Audio

Hay que tener cuidado con la puntuación, puede afectar mucho a romper palabras y saltárselas

jpgallegoar changed discussion status to closed 16 days ago

jpgallegoar changed discussion status to open 16 days ago

nicogiarru

16 days ago

Hola! Gracias desde ya por el trabajo hecho, estoy teniendo problemas tambien para generar el audio, la voz la copia perfecto pero dice cosas extrañas que no son ni pablabras, subi wav de 8 seg con silencios al incicio y al final, sera que tengo mal algun archivo? busco acento argentino, lo poco que s ele llega a entender es con tono español, gracias por la ayuda!! (adjunto audio de original)

https://huggingface.co/jpgallegoar/F5-Spanish/discussions/2#67364acd816b0ef9a2f995c7

Hay que tener cuidado con la puntuación, puede afectar mucho a romper palabras y saltárselas

Espectacular como te queda el resultado, ojala pudiera , recien puntue un poco distinto y mejoro algo el tono, pero sigue haciendo cosas raras, algun consejo en cuanto a la puntuacion?

jpgallegoar

Owner 16 days ago

•

edited 16 days ago

Mientras menos uses, mejor. Hay que ir probando. Si se salta una palabra intenta agregar otro espacio antes de ella. Es muy sensible el modelo, yo lo consideraria una beta. Intentaré hacer algo mejor en el futuro.

lo que mejor entiende son los puntos, el resto mejor ni incluirlos. los acentos sí

KairosArg

15 days ago

•

edited 15 days ago

no hablo demasiado rapido , funciona mal y lo demas es buscar excusas, jaja pareces funcionario publico argentino. lo real es que quisieron adaptar un modelo en ingles y no sirve

OverMage

15 days ago

Yo descargue el modelo y cambie el que pinokio usa por defecto y la verdad me funciona muy bien, eso sí hay que escribir con muy buena ortografía, funciona mejor si tu audio no tiene ruido de fondo y además vocalizas

jpgallegoar changed discussion status to closed 15 days ago