kazuma313
/

gemma-dokter-ft2

Generated from Trainer

Model card Files Files and versions Community

kazuma313 commited on Mar 27

Commit

4eb01a8

•

1 Parent(s): d25b728

Assisten-dokter

Files changed (2) hide show

README.md +7 -5
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -5,6 +5,8 @@ tags:
 - trl
 - sft
 - generated_from_trainer
 base_model: google/gemma-2b
 model-index:
 - name: results
@@ -16,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 # results
-This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on an unknown dataset.
 ## Model description
@@ -35,19 +37,19 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-06
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
-- lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- training_steps: 4000
 ### Framework versions
 - PEFT 0.10.0
-- Transformers 4.38.2
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 - trl
 - sft
 - generated_from_trainer
+datasets:
+- generator
 base_model: google/gemma-2b
 model-index:
 - name: results
 # results
+This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on the generator dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 1
 ### Framework versions
 - PEFT 0.10.0
+- Transformers 4.39.1
 - Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:003e8e0ad96fc85f3e137d4a6e37edf49a5478ca9dfc30467f599287746f947e
 size 28634880

 version https://git-lfs.github.com/spec/v1
+oid sha256:d1f00bfc0ee8259e720935d277300ec6e756e43f0af643d6961e7eb734adb960
 size 28634880