Spaces:

flax-community
/

dalle-mini

Running

boris commited on Jul 13, 2021

Commit

650ecb1

•

1 Parent(s): 8ba598c

feat: update script

Files changed (2) hide show

seq2seq/do_run.sh CHANGED Viewed

@@ -3,9 +3,14 @@ python run_seq2seq_flax.py \
 	--train_file /data/CC12M/encoded-small-train.tsv \
 	--validation_file /data/CC12M/encoded-small-valid.tsv \
 	--output_dir output \
-	--per_device_train_batch_size 24 \
-	--per_device_eval_batch_size 24 \
-	--preprocessing_num_workers 48 \
 	--warmup_steps 1000 \
 	--do_train \
 	--do_eval \

 	--train_file /data/CC12M/encoded-small-train.tsv \
 	--validation_file /data/CC12M/encoded-small-valid.tsv \
 	--output_dir output \
+	--per_device_train_batch_size 56 \
+	--per_device_eval_batch_size 56 \
+	--preprocessing_num_workers 80 \
 	--warmup_steps 1000 \
+	--gradient_accumulation_steps 8 \
 	--do_train \
 	--do_eval \
+	--adafactor \
+	--num_train_epochs 1 \
+	--max_train_samples 200000 \
+	--learning_rate

seq2seq/sweep.yaml CHANGED Viewed

@@ -25,7 +25,7 @@ command:
   - "--num_train_epochs"
   - 1
   - "--max_train_samples"
-  - 1000
   - "--per_device_train_batch_size"
   - 32
   - "--per_device_eval_batch_size"

   - "--num_train_epochs"
   - 1
   - "--max_train_samples"
+  - 200000
   - "--per_device_train_batch_size"
   - 32
   - "--per_device_eval_batch_size"