File size: 2,777 Bytes
31d29dc
076d2eb
 
 
 
31d29dc
076d2eb
31d29dc
 
 
076d2eb
31d29dc
 
34b72d4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
---
title: Pdf2audio Fr
emoji: 🔥
colorFrom: indigo
colorTo: purple
sdk: gradio
sdk_version: 4.44.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: version of pdf2audio in french
---

# Convertisseur PDF en Audio

Cette application Gradio convertit des PDF en podcasts, cours, résumés et plus encore. Elle utilise les modèles GPT d'OpenAI pour la génération de texte.
Pour la génération audio elle utilise la bibliothèque python edge-tts.

## Fonctionnalités

- Télécharger plusieurs fichiers PDF
- Choisir parmi différents modèles d'instructions (podcast, cours, résumé, etc.)
- Personnaliser la génération de texte et les modèles audio
- Sélectionner différentes voix pour les intervenants

## Comment utiliser

1. Télécharger un ou plusieurs fichiers PDF
2. Sélectionner le modèle d'instruction souhaité
3. Personnaliser les instructions si nécessaire
4. Cliquez sur "Générer l'audio" pour créer votre contenu audio

## Utilisation dans Colab

[![Ouvrir dans Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb)

## Exemple audio

<audio controls>
  <source src="https://raw.githubusercontent.com/lamm-mit/PDF2Audio/main/SciAgents%20discovery%20summary%20-%20example.mp3" type="audio/mpeg">
  Votre navigateur ne prend pas en charge l'élément audio.
</audio>

## Remarque

Cette application nécessite une clé API OpenAI pour fonctionner.

## Crédits

Ce projet a été inspiré et basé sur le code disponible à [https://github.com/knowsuchagency/pdf-to-podcast](https://github.com/knowsuchagency/pdf-to-podcast) et [https://github.com/knowsuchagency/promptic](https://github.com/knowsuchagency/promptic).

Dépôt original GitHub : [lamm-mit/PDF2Audio](https://github.com/lamm-mit/PDF2Audio)

Dépôt de la version traduite en français: [jobpilot/pdf2audio](https://huggingface.co/spaces/jobpilot/pdf2audio)

```bibtex
@article{ghafarollahi2024sciagentsautomatingscientificdiscovery,
    title={SciAgents : Automatisation de la découverte scientifique grâce à la raison graphique intelligente multi-agent}, 
    author={Alireza Ghafarollahi et Markus J. Buehler},
    year={2024},
    eprint={2409.05556},
    archivePrefix={arXiv},
    primaryClass={cs.AI},
    url={https://arxiv.org/abs/2409.05556}, 
}
@article{buehler2024graphreasoning,
    title={Accélération de la découverte scientifique avec l'extraction de connaissances génératives, la représentation graphique et la raison graphique intelligente multimodale},
    author={Markus J. Buehler},
    journal={Machine Learning : Science et Technologie},
    year={2024},
    url={http://iopscience.iop.org/article/10.1088/2632-2153/ad7228},
}
```