rbanfield
/

clip-vit-large-patch14

Zero-Shot Image Classification

Inference Endpoints

Model card Files Files and versions Community

rbanfield commited on Nov 1, 2023

Commit

418414b

•

1 Parent(s): 8182cb1

Update handler.py

Files changed (1) hide show

handler.py +16 -12

handler.py CHANGED Viewed

@@ -13,20 +13,24 @@ class EndpointHandler():
         self.processor = CLIPProcessor.from_pretrained("rbanfield/clip-vit-large-patch14")
     def __call__(self, data):
-        inputs = data.pop("inputs", None)
-        text_input = inputs["text"] if "text" in inputs else None
-        image_input = inputs["image"] if "image" in inputs else None
         if text_input:
-            processor = self.processor(text=text_input, return_tensors="pt", padding=True)
-            processor.to("cpu")
             with torch.no_grad():
-                return self.model.get_text_features(**processor).tolist()
-        elif image_input:
-            image = Image.open(BytesIO(base64.b64decode(image_input)))
-            processor = self.processor(images=image, return_tensors="pt")
-            processor.to("cpu")
             with torch.no_grad():
-                return self.model.get_image_features(**processor).tolist()
         else:
-            return None

         self.processor = CLIPProcessor.from_pretrained("rbanfield/clip-vit-large-patch14")
     def __call__(self, data):
+        text_input = None
+        if isinstance(data, dict):
+            inputs = data.pop("inputs", None)
+            text_input = inputs.get('text',None)
+            image_data = BytesIO(base64.b64decode(inputs['image'])) if 'image' in inputs else None
+        else:
+            # assuming its an image sent via binary
+            image_data = BytesIO(data)
         if text_input:
+            processor = self.processor(text=text_input, return_tensors="pt", padding=True).to(device)
             with torch.no_grad():
+                return {"embeddings": self.model.get_text_features(**processor).tolist()}
+        elif image_data:
+            image = Image.open(image_data)
+            processor = self.processor(images=image, return_tensors="pt").to(device)
             with torch.no_grad():
+                return {"embeddings": self.model.get_image_features(**processor).tolist()}
         else:
+            return {"embeddings": None}