Spaces:

markqiu
/

prinvest_mate

Sleeping

App Files Files Community

Tuchuanhuhuhu commited on May 25, 2023

Commit

ee70a9d

•

1 Parent(s): c4a5dd4

更新langchain版本，默认不自动总结，使用google替换duckduckgo

Browse files

Files changed (3) hide show

modules/index_func.py +1 -1
modules/models/base_model.py +18 -18
requirements.txt +2 -2

modules/index_func.py CHANGED Viewed

@@ -83,7 +83,7 @@ def get_documents(file_src):
             logging.error(f"Error loading file: {filename}")
             traceback.print_exc()
-        texts = text_splitter.split_documents([texts])
         documents.extend(texts)
     logging.debug("Documents loaded.")
     return documents

             logging.error(f"Error loading file: {filename}")
             traceback.print_exc()
+        texts = text_splitter.split_documents(texts)
         documents.extend(texts)
     logging.debug("Documents loaded.")
     return documents

modules/models/base_model.py CHANGED Viewed

@@ -13,7 +13,7 @@ import pathlib
 from tqdm import tqdm
 import colorama
-from duckduckgo_search import ddg
 import asyncio
 import aiohttp
 from enum import Enum
@@ -264,19 +264,19 @@ class BaseLLMModel:
             index = construct_index(self.api_key, file_src=files)
             status = i18n("索引构建完成")
             # Summarize the document
-            logging.info(i18n("生成内容总结中……"))
-            os.environ["OPENAI_API_KEY"] = self.api_key
-            from langchain.chains.summarize import load_summarize_chain
-            from langchain.prompts import PromptTemplate
-            from langchain.chat_models import ChatOpenAI
-            from langchain.callbacks import StdOutCallbackHandler
-            prompt_template = "Write a concise summary of the following:\n\n{text}\n\nCONCISE SUMMARY IN " + language + ":"
-            PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
-            llm = ChatOpenAI()
-            chain = load_summarize_chain(llm, chain_type="map_reduce", return_intermediate_steps=True, map_prompt=PROMPT, combine_prompt=PROMPT)
-            summary = chain({"input_documents": list(index.docstore.__dict__["_dict"].values())}, return_only_outputs=True)["output_text"]
-            print(i18n("总结") + f": {summary}")
-            chatbot.append([i18n("上传了")+len(files)+"个文件", summary])
         return gr.Files.update(), chatbot, status
     def prepare_inputs(self, real_inputs, use_websearch, files, reply_language, chatbot):
@@ -309,15 +309,15 @@ class BaseLLMModel:
             )
         elif use_websearch:
             limited_context = True
-            search_results = ddg(real_inputs, max_results=5)
             reference_results = []
             for idx, result in enumerate(search_results):
                 logging.debug(f"搜索结果{idx + 1}：{result}")
-                domain_name = urllib3.util.parse_url(result["href"]).host
-                reference_results.append([result["body"], result["href"]])
                 display_append.append(
                     # f"{idx+1}. [{domain_name}]({result['href']})\n"
-                    f"<li><a href=\"{result['href']}\" target=\"_blank\">{domain_name}</a></li>\n"
                 )
             reference_results = add_source_numbers(reference_results)
             display_append = "<ol>\n\n" + "".join(display_append) + "</ol>"

 from tqdm import tqdm
 import colorama
+from googlesearch import search
 import asyncio
 import aiohttp
 from enum import Enum
             index = construct_index(self.api_key, file_src=files)
             status = i18n("索引构建完成")
             # Summarize the document
+            # logging.info(i18n("生成内容总结中……"))
+            # os.environ["OPENAI_API_KEY"] = self.api_key
+            # from langchain.chains.summarize import load_summarize_chain
+            # from langchain.prompts import PromptTemplate
+            # from langchain.chat_models import ChatOpenAI
+            # from langchain.callbacks import StdOutCallbackHandler
+            # prompt_template = "Write a concise summary of the following:\n\n{text}\n\nCONCISE SUMMARY IN " + language + ":"
+            # PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
+            # llm = ChatOpenAI()
+            # chain = load_summarize_chain(llm, chain_type="map_reduce", return_intermediate_steps=True, map_prompt=PROMPT, combine_prompt=PROMPT)
+            # summary = chain({"input_documents": list(index.docstore.__dict__["_dict"].values())}, return_only_outputs=True)["output_text"]
+            # print(i18n("总结") + f": {summary}")
+            # chatbot.append([i18n("上传了")+str(len(files))+"个文件", summary])
         return gr.Files.update(), chatbot, status
     def prepare_inputs(self, real_inputs, use_websearch, files, reply_language, chatbot):
             )
         elif use_websearch:
             limited_context = True
+            search_results = [i for i in search(real_inputs, advanced=True)]
             reference_results = []
             for idx, result in enumerate(search_results):
                 logging.debug(f"搜索结果{idx + 1}：{result}")
+                domain_name = urllib3.util.parse_url(result.url).host
+                reference_results.append([result.description, result.url])
                 display_append.append(
                     # f"{idx+1}. [{domain_name}]({result['href']})\n"
+                    f"<li><a href=\"{result.url}\" target=\"_blank\">{domain_name}</a></li>\n"
                 )
             reference_results = add_source_numbers(reference_results)
             display_append = "<ol>\n\n" + "".join(display_append) + "</ol>"

requirements.txt CHANGED Viewed

@@ -6,9 +6,9 @@ tiktoken
 socksio
 tqdm
 colorama
-duckduckgo_search==2.9.5
 Pygments
-langchain==0.0.142
 markdown
 PyPDF2
 pdfplumber

 socksio
 tqdm
 colorama
+googlesearch-python
 Pygments
+langchain==0.0.180
 markdown
 PyPDF2
 pdfplumber