Abhi Venigalla

#50 opened over 1 year ago by

vi-c

Pad_token_id of MPT-7B

#49 opened over 1 year ago by

Trung-Dung

Running on single Nvidia K80 GPU with large context to generate long output

#29 opened over 1 year ago by

airtable

Speed on CPU

13

#8 opened over 1 year ago by

zokica

H100 TransformerEngine

#14 opened over 1 year ago by

SinanAkkoyun

Using `self.transformer.wte.weight` directly for LM head breaks HF accelerate device map auto infer on multi-gpu

#46 opened over 1 year ago by

shijie-wu

Create requirements.txt

#22 opened over 1 year ago by

shijie-wu

New activity in mosaicml/mpt-7b-instruct over 1 year ago

configuration / penalty to lower repetition?

#32 opened over 1 year ago by

mfab

How much GPU memory is needed to finetune MPT-7B Instruct model?

#31 opened over 1 year ago by

skshreyas714

Provide fine-tuning example notebook using hf transformers

6

#22 opened over 1 year ago by

MakerMotion

GPU Memory / RAM requierements

8

#19 opened over 1 year ago by

Rbn3D

Help Needed!! Text Generation Taking Too Long

#17 opened over 1 year ago by

debajyoti111

Error in Triton implementation

#9 opened over 1 year ago by

narenzen

Error in Installation Setup

#24 opened over 1 year ago by

souvik0306

KeyError in triton implementation

7

#25 opened over 1 year ago by

datacow

8bit and sharded weights

#37 opened over 1 year ago by

ThreeBlessings

ValueError: MPTForCausalLM does not support `device_map='auto'` yet.

#38 opened over 1 year ago by

AayushShah

Super slow loading compared to other (even bigger) models

11

#6 opened over 1 year ago by

kil3r

Support Auto Device Map

#4 opened over 1 year ago by

Supreeth

Multi-GPU inference using accelerate

6

#23 opened over 1 year ago by

dataviral

New activity in mosaicml/mpt-7b-chat over 1 year ago

reproduce mpt-7b-chat

#6 opened over 1 year ago by

ehartford

Error when deploying

4

#3 opened over 1 year ago by

JosephH

Does not support device_map

#14 opened over 1 year ago by

HAvietisov

Out of memory error with an RTX 4090

10

#7 opened over 1 year ago by

antman1p

New activity in mosaicml/mpt-7b-storywriter over 1 year ago

finetune

#17 opened over 1 year ago by

vinnitu

Text loading

6

#8 opened over 1 year ago by

antonmks

Any reason why this longer context length wasn't applied to the chat and instruct versions?

4

#29 opened over 1 year ago by

RonanMcGovern

Problem loading model

#28 opened over 1 year ago by

jdc4429

Error while trying to run mpt-7-storyteller

#30 opened over 1 year ago by

paulovasconcellos

LLM Foundry Updates 06-01-2023

#33 opened over 1 year ago by

New activity in mosaicml/mpt-7b-chat over 1 year ago

LLM Foundry Updates 06-01-2023

#17 opened over 1 year ago by

New activity in mosaicml/mpt-7b-instruct over 1 year ago

LLM Foundry Updates 06-01-2023

#41 opened over 1 year ago by

New activity in mosaicml/mpt-7b over 1 year ago

LLM Foundry Updates 06-01-2023

#47 opened over 1 year ago by

Support device_map="auto" when loading

19

#23 opened over 1 year ago by

shijie-wu

New activity in mosaicml/mpt-7b-chat over 1 year ago

Update modeling_mpt.py

#16 opened over 1 year ago by

New activity in mosaicml/mpt-7b-storywriter over 1 year ago

Update modeling_mpt.py

#32 opened over 1 year ago by

New activity in mosaicml/mpt-7b-instruct over 1 year ago

Update modeling_mpt.py

#40 opened over 1 year ago by

New activity in mosaicml/mpt-7b over 1 year ago

Update modeling_mpt.py

#45 opened over 1 year ago by

attn_impl

11

#27 opened over 1 year ago by

GaaraOtheSand

Can this be fine-tuned with triton backed flash attention and alibi using the huggingface transformers trainer?

#13 opened over 1 year ago by

winglian

New activity in mosaicml/mpt-7b-instruct over 1 year ago

flash_attn on gpu

#20 opened over 1 year ago by

uglydumpling

New activity in mosaicml/mpt-7b over 1 year ago

PyTorch model architecture doubt

#19 opened over 1 year ago by

JacopoBandoni

Where I can find the remote code?

#15 opened over 1 year ago by

llm34323

The model is a troll >D

#17 opened over 1 year ago by

pplanel

New activity in mosaicml/mpt-7b-instruct over 1 year ago

What task does it support?

#10 opened over 1 year ago by

vshetty

How can I extract embeddings from this model?

#16 opened over 1 year ago by

MehtabPathan

Where I can find remote code?

#12 opened over 1 year ago by

llm34323

New activity in mosaicml/mpt-7b over 1 year ago

The environment to run training of mpt

#12 opened over 1 year ago by

wangjw-bd

CPU support?