vipinkatara
/

Mistral-7B-v0.1-orpo-final1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Mistral-7B-v0.1-orpo-final1 / eval_results.json

vipinkatara's picture

End of training

8a1281c verified 7 months ago

history blame contribute delete

526 Bytes

	{
	"epoch": 1.0,
	"eval_log_odds_chosen": NaN,
	"eval_log_odds_ratio": NaN,
	"eval_logits/chosen": NaN,
	"eval_logits/rejected": NaN,
	"eval_logps/chosen": NaN,
	"eval_logps/rejected": NaN,
	"eval_loss": NaN,
	"eval_nll_loss": NaN,
	"eval_rewards/accuracies": 0.0,
	"eval_rewards/chosen": NaN,
	"eval_rewards/margins": NaN,
	"eval_rewards/rejected": NaN,
	"eval_runtime": 306.8444,
	"eval_samples": 17893,
	"eval_samples_per_second": 58.313,
	"eval_steps_per_second": 1.825
	}