Spaces:

derek-thomas
/

transformer_calculator

Running

derek-thomas HF staff commited on Sep 13

Commit

e16200c

•

1 Parent(s): 4db8e8b

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -64,7 +64,7 @@ def calc_mem(hf_model_name_or_path, num_gpus, tensor_parallel_size, pipeline_par
 # ---- FLOP Calculation ---- #
 def calc_flops(vocab_size, hidden_size, sequence_length, num_layers, kv_size_ratio, topk, moe, num_experts, expert_interval, batch_size, tokens, checkpoint_activations, ffn_expansion_factor, infer):
     # An A_(m x k) X B_(k x n) matrix multiplication requires 2m x k x n FLOPs (factor of 2 needed to account for multiplies and adds)
     # determine the flops factor.
     iter_factor = 3
     if checkpoint_activations:
@@ -370,9 +370,9 @@ with gr.Blocks() as demo:
                         info="Global batch size in units of samples"
                     )
                     tokens = gr.Number(
-                        label="Number of Tokens",
-                        value=300e9,
-                        info="Total number of tokens for training"
                     )
                     checkpoint_activations = gr.Checkbox(
                         label="Checkpoint Activations",

 # ---- FLOP Calculation ---- #
 def calc_flops(vocab_size, hidden_size, sequence_length, num_layers, kv_size_ratio, topk, moe, num_experts, expert_interval, batch_size, tokens, checkpoint_activations, ffn_expansion_factor, infer):
     # An A_(m x k) X B_(k x n) matrix multiplication requires 2m x k x n FLOPs (factor of 2 needed to account for multiplies and adds)
+    tokens = 1e9 * tokens
     # determine the flops factor.
     iter_factor = 3
     if checkpoint_activations:
                         info="Global batch size in units of samples"
                     )
                     tokens = gr.Number(
+                        label="Number of GigaTokens",
+                        value=300,
+                        info="Total number of GigaTokens for training"
                     )
                     checkpoint_activations = gr.Checkbox(
                         label="Checkpoint Activations",