pkbiswas
/

Phi-1_5-Detoxified-PPO-LoRa

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Phi-1_5-Detoxified-PPO-LoRa / tokenizer_config.json

Commit History

Push model using huggingface_hub.

70cf630
verified

pkbiswas commited on Apr 20