Spaces:

drewThomasson
/

OuteTTS-DEMO

Running

App Files Files Community

drewThomasson commited on 29 days ago

Commit

6ca77a8

•

1 Parent(s): 76d9165

Update app.py

Browse files

Files changed (1) hide show

app.py +54 -14

app.py CHANGED Viewed

@@ -5,24 +5,64 @@ from outetts.v0_1.interface import InterfaceHF
 interface = InterfaceHF("OuteAI/OuteTTS-0.1-350M")
 def generate_tts(text, temperature, repetition_penalty, max_length):
     output = interface.generate(
         text=text,
         temperature=temperature,
         repetition_penalty=repetition_penalty,
         max_lenght=max_length
     )
-    return output  # Gradio will play the audio directly
-# Gradio interface components
-gr.Interface(
-    fn=generate_tts,
-    inputs=[
-        gr.Textbox(label="Text Input", placeholder="Enter the text for TTS generation"),
-        gr.Slider(0.1, 1.0, value=0.1, step=0.01, label="Temperature"),
-        gr.Slider(0.5, 2.0, value=1.1, step=0.1, label="Repetition Penalty"),
-        gr.Slider(256, 4096, value=1024, step=256, label="Max Length")
-    ],
-    outputs=gr.Audio(label="Generated Speech"),
-    title="OuteTTS - Text to Speech Interface",
-    description="Generate speech from text using the OuteTTS model."
-).launch()

 interface = InterfaceHF("OuteAI/OuteTTS-0.1-350M")
 def generate_tts(text, temperature, repetition_penalty, max_length):
+    # Logging information to the terminal
+    print("Generating TTS with the following parameters:")
+    print(f"Text: {text}")
+    print(f"Temperature: {temperature}")
+    print(f"Repetition Penalty: {repetition_penalty}")
+    print(f"Max Length: {max_length}")
     output = interface.generate(
         text=text,
         temperature=temperature,
         repetition_penalty=repetition_penalty,
         max_lenght=max_length
     )
+    print("TTS generation complete. Output ready.")
+    return output  # Gradio will handle the audio directly
+# Gradio Blocks API for structured UI
+with gr.Blocks() as demo:
+    gr.Markdown("# OuteTTS - Text to Speech Interface")
+    gr.Markdown("Generate speech from text using the OuteTTS model.")
+    with gr.Row():
+        text_input = gr.Textbox(
+            label="Text Input",
+            placeholder="Enter the text for TTS generation",
+            lines=3
+        )
+    temperature = gr.Slider(
+        minimum=0.1,
+        maximum=1.0,
+        value=0.1,
+        step=0.01,
+        label="Temperature"
+    )
+    repetition_penalty = gr.Slider(
+        minimum=0.5,
+        maximum=2.0,
+        value=1.1,
+        step=0.1,
+        label="Repetition Penalty"
+    )
+    max_length = gr.Slider(
+        minimum=256,
+        maximum=4096,
+        value=1024,
+        step=256,
+        label="Max Length"
+    )
+    output_audio = gr.Audio(label="Generated Speech", type="auto")
+    generate_button = gr.Button("Generate Speech")
+    generate_button.click(
+        fn=generate_tts,
+        inputs=[text_input, temperature, repetition_penalty, max_length],
+        outputs=output_audio
+    )
+# Launch the Gradio demo
+demo.launch()