File size: 23,338 Bytes

637a1b3

CONFIG
├── data
│   └── _target_: matcha.data.text_mel_datamodule.TextMelDataModule                                                                                                           
│       name: ja005                                                                                                                                                           
│       train_filelist_path: datas/ja005/train.cleaned.txt                                                                                                                    
│       valid_filelist_path: datas/ja005/valid.cleaned.txt                                                                                                                    
│       batch_size: 80                                                                                                                                                        
│       num_workers: 1                                                                                                                                                        
│       pin_memory: true                                                                                                                                                      
│       cleaners:                                                                                                                                                             
│       - basic_cleaners2                                                                                                                                                     
│       add_blank: true                                                                                                                                                       
│       n_spks: 1                                                                                                                                                             
│       n_fft: 1024                                                                                                                                                           
│       n_feats: 80                                                                                                                                                           
│       sample_rate: 22050                                                                                                                                                    
│       hop_length: 256                                                                                                                                                       
│       win_length: 1024                                                                                                                                                      
│       f_min: 0                                                                                                                                                              
│       f_max: 8000                                                                                                                                                           
│       data_statistics:                                                                                                                                                      
│         mel_mean: -5.925878047943115                                                                                                                                        
│         mel_std: 2.230491876602173                                                                                                                                          
│       seed: 3000                                                                                                                                                            
│       load_durations: false                                                                                                                                                 
│                                                                                                                                                                             
├── model
│   └── _target_: matcha.models.matcha_tts.MatchaTTS                                                                                                                          
│       n_vocab: 178                                                                                                                                                          
│       n_spks: 1                                                                                                                                                             
│       spk_emb_dim: 64                                                                                                                                                       
│       n_feats: 80                                                                                                                                                           
│       data_statistics:                                                                                                                                                      
│         mel_mean: -5.925878047943115                                                                                                                                        
│         mel_std: 2.230491876602173                                                                                                                                          
│       out_size: null                                                                                                                                                        
│       prior_loss: true                                                                                                                                                      
│       use_precomputed_durations: false                                                                                                                                      
│       encoder:                                                                                                                                                              
│         encoder_type: RoPE Encoder                                                                                                                                          
│         encoder_params:                                                                                                                                                     
│           n_feats: 80                                                                                                                                                       
│           n_channels: 192                                                                                                                                                   
│           filter_channels: 768                                                                                                                                              
│           filter_channels_dp: 256                                                                                                                                           
│           n_heads: 2                                                                                                                                                        
│           n_layers: 6                                                                                                                                                       
│           kernel_size: 3                                                                                                                                                    
│           p_dropout: 0.1                                                                                                                                                    
│           spk_emb_dim: 64                                                                                                                                                   
│           n_spks: 1                                                                                                                                                         
│           prenet: true                                                                                                                                                      
│         duration_predictor_params:                                                                                                                                          
│           filter_channels_dp: 256                                                                                                                                           
│           kernel_size: 3                                                                                                                                                    
│           p_dropout: 0.1                                                                                                                                                    
│       decoder:                                                                                                                                                              
│         channels:                                                                                                                                                           
│         - 256                                                                                                                                                               
│         - 256                                                                                                                                                               
│         dropout: 0.05                                                                                                                                                       
│         attention_head_dim: 64                                                                                                                                              
│         n_blocks: 1                                                                                                                                                         
│         num_mid_blocks: 2                                                                                                                                                   
│         num_heads: 2                                                                                                                                                        
│         act_fn: snakebeta                                                                                                                                                   
│       cfm:                                                                                                                                                                  
│         name: CFM                                                                                                                                                           
│         solver: euler                                                                                                                                                       
│         sigma_min: 0.0001                                                                                                                                                   
│       optimizer:                                                                                                                                                            
│         _target_: torch.optim.Adam                                                                                                                                          
│         _partial_: true                                                                                                                                                     
│         lr: 0.0001                                                                                                                                                          
│         weight_decay: 0.0                                                                                                                                                   
│                                                                                                                                                                             
├── callbacks
│   └── model_checkpoint:                                                                                                                                                     
│         _target_: lightning.pytorch.callbacks.ModelCheckpoint                                                                                                               
│         dirpath: /notebooks/Matcha-TTS-Japanese/logs/train/ja005/runs/2024-09-19_03-24-56/checkpoints                                                                       
│         filename: checkpoint_{epoch:04d}                                                                                                                                    
│         monitor: epoch                                                                                                                                                      
│         verbose: false                                                                                                                                                      
│         save_last: true                                                                                                                                                     
│         save_top_k: 25                                                                                                                                                      
│         mode: max                                                                                                                                                           
│         auto_insert_metric_name: true                                                                                                                                       
│         save_weights_only: false                                                                                                                                            
│         every_n_train_steps: null                                                                                                                                           
│         train_time_interval: null                                                                                                                                           
│         every_n_epochs: 25                                                                                                                                                  
│         save_on_train_epoch_end: null                                                                                                                                       
│       model_summary:                                                                                                                                                        
│         _target_: lightning.pytorch.callbacks.RichModelSummary                                                                                                              
│         max_depth: 3                                                                                                                                                        
│       rich_progress_bar:                                                                                                                                                    
│         _target_: lightning.pytorch.callbacks.RichProgressBar                                                                                                               
│                                                                                                                                                                             
├── logger
│   └── tensorboard:                                                                                                                                                          
│         _target_: lightning.pytorch.loggers.tensorboard.TensorBoardLogger                                                                                                   
│         save_dir: /notebooks/Matcha-TTS-Japanese/logs/train/ja005/runs/2024-09-19_03-24-56/tensorboard/                                                                     
│         name: null                                                                                                                                                          
│         log_graph: false                                                                                                                                                    
│         default_hp_metric: true                                                                                                                                             
│         prefix: ''                                                                                                                                                          
│                                                                                                                                                                             
├── trainer
│   └── _target_: lightning.pytorch.trainer.Trainer                                                                                                                           
│       default_root_dir: /notebooks/Matcha-TTS-Japanese/logs/train/ja005/runs/2024-09-19_03-24-56                                                                            
│       max_epochs: -1                                                                                                                                                        
│       accelerator: gpu                                                                                                                                                      
│       devices:                                                                                                                                                              
│       - 0                                                                                                                                                                   
│       precision: 16-mixed                                                                                                                                                   
│       check_val_every_n_epoch: 1                                                                                                                                            
│       deterministic: false                                                                                                                                                  
│       gradient_clip_val: 5.0                                                                                                                                                
│                                                                                                                                                                             
├── paths
│   └── root_dir: /notebooks/Matcha-TTS-Japanese                                                                                                                              
│       data_dir: /notebooks/Matcha-TTS-Japanese/data/                                                                                                                        
│       log_dir: /notebooks/Matcha-TTS-Japanese/logs/                                                                                                                         
│       output_dir: /notebooks/Matcha-TTS-Japanese/logs/train/ja005/runs/2024-09-19_03-24-56                                                                                  
│       work_dir: /notebooks/Matcha-TTS-Japanese                                                                                                                              
│                                                                                                                                                                             
├── extras
│   └── ignore_warnings: false                                                                                                                                                
│       enforce_tags: true                                                                                                                                                    
│       print_config: true                                                                                                                                                    
│                                                                                                                                                                             
├── task_name
│   └── train                                                                                                                                                                 
├── run_name
│   └── ja005                                                                                                                                                                 
├── tags
│   └── ['ja005']                                                                                                                                                             
├── train
│   └── True                                                                                                                                                                  
├── test
│   └── True                                                                                                                                                                  
├── ckpt_path
│   └── datas/ja005/last.ckpt                                                                                                                                                 
└── seed
    └── 1234