Spaces:

fistyyy
/

Music_LMMs

Running

App Files Files Community

fistyee commited on Sep 24, 2024

Commit

2fc6c45

1 Parent(s): 2e8ce10

add

Browse files

Files changed (5) hide show

__pycache__/evaluation_processor.cpython-311.pyc +0 -0
__pycache__/image_processor.cpython-311.pyc +0 -0
evaluation_processor.py +56 -0
image_processor.py +52 -0
app.py → main.py +44 -69

__pycache__/evaluation_processor.cpython-311.pyc ADDED Viewed

Binary file (3.36 kB). View file

__pycache__/image_processor.cpython-311.pyc ADDED Viewed

Binary file (3.41 kB). View file

evaluation_processor.py ADDED Viewed

	@@ -0,0 +1,56 @@

+import requests
+import time
+class EvaluationProcessor:
+    def __init__(self, api_key):
+        self.api_key = api_key
+        self.audio_url = 'https://test.aitanzou.com/web/api/submit_audio'
+        self.video_url = 'https://test.aitanzou.com/web/api/submit_video'
+        self.result_url = 'https://test.aitanzou.com/web/api/getEvaluationResult'
+        self.headers = {
+            'API-Key': self.api_key
+        }
+    def submit_evaluation(self, file_path, music_id=None, hand=-1, order_start=0, order_end=-1, repeat_type=0, is_video=False):
+        url = self.video_url if is_video else self.audio_url
+        files = {
+            'file': ("video_file.mp4", open(file_path, 'rb'),  'video/mp4')  # 确保给文件指定一个名称
+        }
+        data = {
+            'musicId': music_id,
+            'hand': hand,
+            'orderStart': order_start,
+            'orderEnd': order_end,
+            'repeatType': repeat_type
+        }
+        response = requests.post(url, headers=self.headers, files=files, data=data)
+        if response.status_code == 200:
+            data = response.json()
+            task_id = data['data']['taskId']
+            return task_id
+        else:
+            raise Exception(f'Error: {response.status_code}, {response.text}')
+    def get_evaluation_result(self, task_id):
+        params = {'taskId': task_id}
+        while True:
+            result_response = requests.get(self.result_url, headers=self.headers, params=params)
+            if result_response.status_code == 200:
+                result_data = result_response.json()
+                status = result_data['data']['status']
+                if status in ['pending', 'processing']:
+                    print(f'Task is still {status}...')
+                    time.sleep(2)
+                elif status == 'completed':
+                    return result_data['data']
+                else:
+                    raise Exception(f'Task failed: {result_data["message"]}')
+            else:
+                raise Exception(f'Error: {result_response.status_code}, {result_response.text}')
+    def process_evaluation(self, file_path, music_id=None, hand=-1, order_start=0, order_end=-1, repeat_type=0, is_video=False):
+        task_id = self.submit_evaluation(file_path, music_id, hand, order_start, order_end, repeat_type, is_video)
+        return self.get_evaluation_result(task_id)

image_processor.py ADDED Viewed

	@@ -0,0 +1,52 @@

+import requests
+import time
+from io import BytesIO
+class ImageProcessor:
+    def __init__(self, api_key):
+        self.api_key = api_key
+        self.submit_url = 'https://test.aitanzou.com/web/api/task/submit'
+        self.result_url = 'https://test.aitanzou.com/web/api/getResult'
+        self.headers = {
+            'API-Key': self.api_key
+        }
+    def submit_images(self, image_bytes_list):
+        files = [('images', ('image.png', image_bytes, 'image/png')) for image_bytes in image_bytes_list]
+        response = requests.post(self.submit_url, headers=self.headers, files=files)
+        if response.status_code == 200:
+            data = response.json()
+            if 'data' in data and 'taskId' in data['data']:
+                task_id = data['data']['taskId']
+                return task_id
+            else:
+                raise Exception(f'Unexpected response format: {data}')
+        else:
+            raise Exception(f'Error: {response.status_code}, {response.text}')
+    def get_result(self, task_id):
+        params = {'taskId': task_id}
+        while True:
+            result_response = requests.get(self.result_url, params=params)
+            if result_response.status_code == 200:
+                result_data = result_response.json()
+                if 'data' in result_data and 'abcPath' in result_data['data']:
+                    if result_data['data']['abcPath'] is None:
+                        print('Task is still pending...')
+                        time.sleep(10)
+                    else:
+                        url = result_data['data']['abcPath']
+                        response = requests.get(url)
+                        if response.status_code == 200:
+                            return response.text
+                        else:
+                            raise Exception(f'Error retrieving file content: {response.status_code}, {response.text}')
+                else:
+                    raise Exception(f'Unexpected result format: {result_data}')
+            else:
+                raise Exception(f'Error: {result_response.status_code}, {result_response.text}')
+    def process_images(self, image_bytes_list):
+        task_id = self.submit_images(image_bytes_list)
+        return self.get_result(task_id)

app.py → main.py RENAMED Viewed

@@ -1,82 +1,30 @@
 import gradio as gr
 from PIL import Image
 from io import BytesIO
-import requests
-import time
 import openai
 import os
-from openai import OpenAI
 from dotenv import load_dotenv
 load_dotenv()
-client = OpenAI(
-    # This is the default and can be omitted
-    api_key = os.getenv("OPENAI_API_KEY")
-    #api_key=os.environ.get("OPENAI_API_KEY"),
 )
 # 设置OpenAI API密钥
-openai.api_key = "sk-ut4AJ8UzqsoTVaeIATrXBGfLRcYhZbba04jnSZyOwlT3BlbkFJsEa4UxwYuflmBYBi2oLQnZJIB8-zCzTWJ9QQLMzt8A"
 engine = "gpt-4o-mini"
-class ImageProcessor:
-    def __init__(self, api_key):
-        self.api_key = api_key
-        self.submit_url = 'https://test.aitanzou.com/web/api/task/submit'
-        self.result_url = 'https://test.aitanzou.com/web/api/getResult'
-        self.headers = {
-            'API-Key': self.api_key
-        }
-    def submit_images(self, image_bytes_list):
-        files = [('images', ('image.png', image_bytes, 'image/png')) for image_bytes in image_bytes_list]
-        response = requests.post(self.submit_url, headers=self.headers, files=files)
-        if response.status_code == 200:
-            data = response.json()
-            if 'data' in data and 'taskId' in data['data']:
-                task_id = data['data']['taskId']
-                return task_id
-            else:
-                raise Exception(f'Unexpected response format: {data}')
-        else:
-            raise Exception(f'Error: {response.status_code}, {response.text}')
-    def get_result(self, task_id):
-        params = {'taskId': task_id}
-        while True:
-            result_response = requests.get(self.result_url, params=params)
-            if result_response.status_code == 200:
-                result_data = result_response.json()
-                if 'data' in result_data and 'abcPath' in result_data['data']:
-                    if result_data['data']['abcPath'] is None:
-                        print('Task is still pending...')
-                        time.sleep(10)
-                    else:
-                        url = result_data['data']['abcPath']
-                        response = requests.get(url)
-                        if response.status_code == 200:
-                            return response.text
-                        else:
-                            raise Exception(f'Error retrieving file content: {response.status_code}, {response.text}')
-                else:
-                    raise Exception(f'Unexpected result format: {result_data}')
-            else:
-                raise Exception(f'Error: {result_response.status_code}, {result_response.text}')
-    def process_images(self, image_bytes_list):
-        task_id = self.submit_images(image_bytes_list)
-        return self.get_result(task_id)
 # 设置Music API密钥
 api_key = 'ddc85b14-bd83-4757-9bc4-8a11194da536'
 image_processor = ImageProcessor(api_key)
 # 定义处理函数
-def process_input(text=None, images=None, audio=None):
     # 创建GPT请求的描述
     system = "1.你是一个专业的钢琴音乐教师，只能回答音乐知识，回复的内容为普通文本格式。如果提供的乐谱是abc记谱法,则回复时不要用abc记谱法,需要转换为传统的普通记谱法使用专业词汇进行回答问题2.你将根据下面指令回答问题，但是不能违反第一条指令,也不能在回复中提及。"
     messages = [{"role": "system", "content": system}]
     prompt = ""
@@ -95,15 +43,43 @@ def process_input(text=None, images=None, audio=None):
         try:
             processed_image_result = image_processor.process_images(image_bytes_list)
-            #prompt += f"\n乐谱的内容如下,这是一首杜维诺伊的曲子，请你根据他的曲风回答问题: {processed_image_result}"
-            prompt += f"\n乐谱的内容如下,这是一首杜维诺伊的曲子，请你根据他的曲风回答问题: {processed_image_result}"
         except Exception as e:
             return f"Error processing image: {e}", None
     if audio:
-        # 将音频转换为描述（这里简单地用占位符）
-        prompt += "\nAudio input: A description of the audio has been generated."
     # 使用GPT API进行处理
     try:
@@ -127,14 +103,13 @@ def process_input(text=None, images=None, audio=None):
 iface = gr.Interface(
     fn=process_input,
     inputs=[
-        gr.Textbox(label="Input Text", placeholder="Enter text here", lines=2),  # Text input with submit button
-        gr.File(label="Input Images", file_count="multiple", type="file"),  # 支持多文件上传
-        # gr.Audio(label="Input Audio", type="filepath"),
     ],
     outputs=[
-        gr.Textbox(label="Output Text"),
-        # gr.Audio(label="Output Audio")  # 目前示例中未处理音频输出
     ],
     live=False,
 )

 import gradio as gr
 from PIL import Image
 from io import BytesIO
 import openai
 import os
 from dotenv import load_dotenv
+from image_processor import ImageProcessor
+from evaluation_processor import EvaluationProcessor
 load_dotenv()
+client = openai.OpenAI(
+    api_key=os.getenv("OPENAI_API_KEY")
 )
 # 设置OpenAI API密钥
+openai.api_key = os.getenv("OPENAI_API_KEY")
 engine = "gpt-4o-mini"
 # 设置Music API密钥
 api_key = 'ddc85b14-bd83-4757-9bc4-8a11194da536'
 image_processor = ImageProcessor(api_key)
+evaluation_processor = EvaluationProcessor(api_key)
 # 定义处理函数
+def process_input(text=None, images=None, audio=None, video=None):
     # 创建GPT请求的描述
     system = "1.你是一个专业的钢琴音乐教师，只能回答音乐知识，回复的内容为普通文本格式。如果提供的乐谱是abc记谱法,则回复时不要用abc记谱法,需要转换为传统的普通记谱法使用专业词汇进行回答问题2.你将根据下面指令回答问题，但是不能违反第一条指令,也不能在回复中提及。"
     messages = [{"role": "system", "content": system}]
     prompt = ""
         try:
             processed_image_result = image_processor.process_images(image_bytes_list)
+            #prompt += f"\n乐谱的内容如下,这是一首杜维诺伊的曲子，请你根据曲子的曲风回答问题: {processed_image_result}"
+            prompt += f"\n乐谱的内容如下,请你根据曲子的曲风回答问题: {processed_image_result}"
         except Exception as e:
             return f"Error processing image: {e}", None
     if audio:
+        try:
+            # 使用EvaluationProcessor处理音频
+            audio_path = audio.name
+            result = evaluation_processor.process_evaluation(audio_path, is_video=False)
+            prompt += f'''请你根据
+            "eva_all":综合得分
+            "eva_completion":完整性
+            "eva_note":按键
+            "eva_stability":稳定性
+            "eva_tempo_sync":节奏
+            评价一下评测结果: {result}'''
+        except Exception as e:
+            return f"Error processing audio: {e}", None
+    if video:
+        try:
+            # 使用EvaluationProcessor处理视频
+            video_path = video.name
+            result = evaluation_processor.process_evaluation(video_path, is_video=True)
+            prompt += f'''请你根据
+            "eva_all":综合得分
+            "eva_completion":完整性
+            "eva_note":按键
+            "eva_stability":稳定性
+            "eva_tempo_sync":节奏
+            评价一下评测结果: {result}'''
+        except Exception as e:
+            return f"Error processing video: {e}", None
     # 使用GPT API进行处理
     try:
 iface = gr.Interface(
     fn=process_input,
     inputs=[
+        gr.Textbox(label="Input Text", placeholder="Enter text here", lines=2),  # 文本输入
+        gr.File(label="Input Images", file_count="multiple", type="file"),  # 多文件上传
+        gr.File(label="Input Audio", type="file"),  # 音频文件上传
+        gr.File(label="Input Video", type="file")  # 视频文件上传
     ],
     outputs=[
+        gr.Textbox(label="Output Text")
     ],
     live=False,
 )