Spaces:

ashok2216
/

pdf-chatbot

Running

ashok2216 commited on May 2

Commit

e86eadb

•

1 Parent(s): 9d423d7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,9 +6,19 @@ from transformers import GPT2LMHeadModel, GPT2Tokenizer
 tokenizer = GPT2Tokenizer.from_pretrained("openai-community/gpt2")
 model = GPT2LMHeadModel.from_pretrained("openai-community/gpt2")
-def extract_text_from_pdf(pdf_path):
     text = ""
-    with open(pdf_path, "rb") as f:
         reader = PyPDF2.PdfFileReader(f)
         for page_num in range(reader.numPages):
             text += reader.getPage(page_num).extractText()

 tokenizer = GPT2Tokenizer.from_pretrained("openai-community/gpt2")
 model = GPT2LMHeadModel.from_pretrained("openai-community/gpt2")
+pdf_file = st.file_uploader("Upload an pdf file", type=["pdf"], accept_multiple_files=False)
+if pdf_file is not None:
+    with tempfile.NamedTemporaryFile(delete=False) as tmp_file:
+        tmp_file.write(pdf_file.read())
+        st.success("PDF file successfully uploaded and stored temporally.")
+    file_path = tmp_file.name
+else:
+    st.markdown('File not found!')
+def extract_text_from_pdf(file_path):
     text = ""
+    with open(file_path, "rb") as f:
         reader = PyPDF2.PdfFileReader(f)
         for page_num in range(reader.numPages):
             text += reader.getPage(page_num).extractText()