Spaces:

camparchimedes
/

nb

Build error

App Files Files

camparchimedes commited on Aug 10

Commit

64e12f4

•

1 Parent(s): dda0718

Update app.py

Browse files

Files changed (1) hide show

app.py +7 -7

app.py CHANGED Viewed

@@ -23,7 +23,7 @@ device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 torch_dtype = torch.float32
 # ASR pipeline
-pipe = pipeline("automatic-speech-recognition", model="NbAiLabBeta/nb-whisper-large-semantic", device=device, torch_dtype=torch.float32)
 # Switch m4a to wav
 def convert_to_wav(audio_file):
@@ -35,7 +35,7 @@ def convert_to_wav(audio_file):
 # @spaces.GPU(queue=True)
-# Transcription funct.@ASR pipeline
 def transcribe_audio(audio_file):
     if audio_file.endswith(".m4a"):
         audio_file = convert_to_wav(audio_file)
@@ -43,7 +43,7 @@ def transcribe_audio(audio_file):
     start_time = time.time()
     with torch.no_grad():
-        output = pipe(audio_file, chunk_length_s=30, generate_kwargs={"num_beams": 8, "task": "transcribe", "language": "no"})
     transcription = output["text"]
     end_time = time.time()
@@ -82,7 +82,7 @@ def summarize_text(text):
 # HTML syntax for imagery
-image_html = """
 <div style="text-align: center;">
     <img src="https://huggingface.co/spaces/camparchimedes/ola_s-audioshop/raw/main/picture.png" alt="Banner" width="85%" height="auto">
 </div>
@@ -107,7 +107,7 @@ def save_to_pdf(transcription, summary):
     pdf.output(pdf_output_path)
     return pdf_output_path
-# Gradio
 iface = gr.Interface(
     fn=transcribe_audio,
     inputs=gr.Audio(type="filepath"),
@@ -120,7 +120,7 @@ iface = gr.Interface(
 iface = gr.Blocks()
 with iface:
-    gr.HTML(image_html)
     gr.Markdown("# Vi har nå muligheten til å oversette lydfiler til norsk skrift.")
     with gr.Tabs():
@@ -197,4 +197,4 @@ with iface:
 # run
-iface.launch(share=True, debug=True)

 torch_dtype = torch.float32
 # ASR pipeline
+asr = pipeline("automatic-speech-recognition", model="NbAiLabBeta/nb-whisper-large-semantic", device=device, torch_dtype=torch_dtype)
 # Switch m4a to wav
 def convert_to_wav(audio_file):
 # @spaces.GPU(queue=True)
+# Transcription funct.@ASR
 def transcribe_audio(audio_file):
     if audio_file.endswith(".m4a"):
         audio_file = convert_to_wav(audio_file)
     start_time = time.time()
     with torch.no_grad():
+        output = asr(audio_file, chunk_length_s=30, generate_kwargs={"num_beams": 8, "task": "transcribe", "language": "no"})
     transcription = output["text"]
     end_time = time.time()
 # HTML syntax for imagery
+banner_html = """
 <div style="text-align: center;">
     <img src="https://huggingface.co/spaces/camparchimedes/ola_s-audioshop/raw/main/picture.png" alt="Banner" width="85%" height="auto">
 </div>
     pdf.output(pdf_output_path)
     return pdf_output_path
+# Gradio
 iface = gr.Interface(
     fn=transcribe_audio,
     inputs=gr.Audio(type="filepath"),
 iface = gr.Blocks()
 with iface:
+    gr.HTML(banner_html)
     gr.Markdown("# Vi har nå muligheten til å oversette lydfiler til norsk skrift.")
     with gr.Tabs():
 # run
+iface.launch(share=True, debug=True)