Spaces:

MiniMaxAI
/

MiniMax-VL-01

Running

App Files Files Community

MiniMax-AI commited on 3 days ago

Commit

2b4fa99

1 Parent(s): 4c570ae

the first version

Browse files

Files changed (1) hide show

app.py +113 -40

app.py CHANGED Viewed

@@ -1,64 +1,137 @@
 import gradio as gr
-from huggingface_hub import InferenceClient
-"""
-For more information on `huggingface_hub` Inference API support, please check the docs: https://huggingface.co/docs/huggingface_hub/v0.22.2/en/guides/inference
-"""
-client = InferenceClient("HuggingFaceH4/zephyr-7b-beta")
 def respond(
     message,
-    history: list[tuple[str, str]],
-    system_message,
     max_tokens,
     temperature,
     top_p,
 ):
-    messages = [{"role": "system", "content": system_message}]
     for val in history:
-        if val[0]:
-            messages.append({"role": "user", "content": val[0]})
-        if val[1]:
-            messages.append({"role": "assistant", "content": val[1]})
-    messages.append({"role": "user", "content": message})
-    response = ""
-    for message in client.chat_completion(
-        messages,
-        max_tokens=max_tokens,
-        stream=True,
-        temperature=temperature,
-        top_p=top_p,
-    ):
-        token = message.choices[0].delta.content
-        response += token
-        yield response
-"""
-For information on how to customize the ChatInterface, peruse the gradio docs: https://www.gradio.app/docs/chatinterface
-"""
 demo = gr.ChatInterface(
     respond,
     additional_inputs=[
-        gr.Textbox(value="You are a friendly Chatbot.", label="System message"),
-        gr.Slider(minimum=1, maximum=2048, value=512, step=1, label="Max new tokens"),
-        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
-        gr.Slider(
-            minimum=0.1,
-            maximum=1.0,
-            value=0.95,
-            step=0.05,
-            label="Top-p (nucleus sampling)",
-        ),
     ],
 )
-if __name__ == "__main__":
-    demo.launch()

+import base64
 import gradio as gr
+import json
+import mimetypes
+import os
+import requests
+import time
+MODEL_VERSION = os.environ['MODEL_VERSION']
+API_URL = os.environ['API_URL']
+API_KEY = os.environ['API_KEY']
+SYSTEM_PROMPT = os.environ.get('SYSTEM_PROMPT')
+MULTIMODAL_FLAG = os.environ.get('MULTIMODAL')
+MODEL_CONTROL_DEFAULTS = json.loads(os.environ['MODEL_CONTROL_DEFAULTS'])
+NAME_MAP = {
+    'system': os.environ.get('SYSTEM_NAME'),
+    'user': os.environ.get('USER_NAME'),
+}
 def respond(
     message,
+    history,
     max_tokens,
     temperature,
     top_p,
 ):
+    messages = []
+    if SYSTEM_PROMPT is not None:
+        messages.append({
+            'role': 'system',
+            'content': SYSTEM_PROMPT,
+        })
     for val in history:
+        messages.append({
+            'role': val['role'],
+            'content': convert_content(val['content']),
+        })
+    messages.append({
+        'role': 'user',
+        'content': convert_content(message),
+    })
+    for message in messages:
+        add_name_for_message(message)
+    data = {
+        'model': MODEL_VERSION,
+        'messages': messages,
+        'stream': True,
+        'max_tokens': max_tokens,
+        'temperature': temperature,
+        'top_p': top_p,
+    }
+    r = requests.post(
+        API_URL,
+        headers={
+            'Content-Type': 'application/json',
+            'Authorization': 'Bearer {}'.format(API_KEY),
+        },
+        data=json.dumps(data),
+        stream=True,
+    )
+    reply = ''
+    for row in r.iter_lines():
+        if row.startswith(b'data:'):
+            data = json.loads(row[5:])
+            if 'choices' not in data:
+                raise gr.Error('request failed')
+            choice = data['choices'][0]
+            if 'delta' in choice:
+                reply += choice['delta']['content']
+                yield reply
+            elif 'message' in choice:
+                yield choice['message']['content']
+def add_name_for_message(message):
+    name = NAME_MAP.get(message['role'])
+    if name is not None:
+        message['name'] = name
+def convert_content(content):
+    if isinstance(content, str):
+        return content
+    if isinstance(content, tuple):
+        return [{
+            'type': 'image_url',
+            'image_url': {
+                'url': encode_base64(content[0]),
+            },
+        }]
+    content_list = []
+    for key, val in content.items():
+        if key == 'text':
+            content_list.append({
+                'type': 'text',
+                'text': val,
+            })
+        elif key == 'files':
+            for f in val:
+                content_list.append({
+                    'type': 'image_url',
+                    'image_url': {
+                        'url': encode_base64(f),
+                    },
+                })
+    return content_list
+def encode_base64(path):
+    guess_type = mimetypes.guess_type(path)[0]
+    if not guess_type.startswith('image/'):
+        raise gr.Error('not an image ({}): {}'.format(guess_type, path))
+    with open(path, 'rb') as handle:
+        data = handle.read()
+        return 'data:{};base64,{}'.format(
+            guess_type,
+            base64.b64encode(data).decode(),
+        )
 demo = gr.ChatInterface(
     respond,
+    multimodal=MULTIMODAL_FLAG == 'ON',
+    type='messages',
     additional_inputs=[
+        gr.Slider(minimum=1, maximum=1000000, value=MODEL_CONTROL_DEFAULTS['tokens_to_generate'], step=1, label='Tokens to generate'),
+        gr.Slider(minimum=0.1, maximum=1.0, value=MODEL_CONTROL_DEFAULTS['temperature'], step=0.05, label='Temperature'),
+        gr.Slider(minimum=0.1, maximum=1.0, value=MODEL_CONTROL_DEFAULTS['top_p'], step=0.05, label='Top-p (nucleus sampling)'),
     ],
 )
+if __name__ == '__main__':
+    demo.queue(default_concurrency_limit=50).launch()