pradachan
/

AI-Scientist

Model card Files Files and versions Community

AI-Scientist / templates /grokking /plot.py

pradachan

Upload folder using huggingface_hub

f71c233 verified 19 days ago

raw

history blame contribute delete

6.77 kB

	import matplotlib.pyplot as plt
	import matplotlib.colors as mcolors
	import numpy as np
	import json
	import os
	import os.path as osp

	# LOAD FINAL RESULTS:
	datasets = ["x_div_y", "x_minus_y", "x_plus_y", "permutation"]
	folders = os.listdir("./")
	final_results = {}
	results_info = {}
	for folder in folders:
	if folder.startswith("run") and osp.isdir(folder):
	with open(osp.join(folder, "final_info.json"), "r") as f:
	final_results[folder] = json.load(f)
	results_dict = np.load(
	osp.join(folder, "all_results.npy"), allow_pickle=True
	).item()
	print(results_dict.keys())
	run_info = {}
	for dataset in datasets:
	run_info[dataset] = {}
	val_losses = []
	train_losses = []
	val_accs = []
	train_accs = []
	for k in results_dict.keys():
	if dataset in k and "val_info" in k:
	run_info[dataset]["step"] = [
	info["step"] for info in results_dict[k]
	]
	val_losses.append([info["val_loss"] for info in results_dict[k]])
	val_accs.append([info["val_accuracy"] for info in results_dict[k]])
	if dataset in k and "train_info" in k:
	train_losses.append(
	[info["train_loss"] for info in results_dict[k]]
	)
	train_accs.append(
	[info["train_accuracy"] for info in results_dict[k]]
	)
	mean_val_losses = np.mean(val_losses, axis=0)
	mean_train_losses = np.mean(train_losses, axis=0)
	mean_val_accs = np.mean(val_accs, axis=0)
	mean_train_accs = np.mean(train_accs, axis=0)
	if len(val_losses) > 0:
	sterr_val_losses = np.std(val_losses, axis=0) / np.sqrt(
	len(val_losses)
	)
	stderr_train_losses = np.std(train_losses, axis=0) / np.sqrt(
	len(train_losses)
	)
	sterr_val_accs = np.std(val_accs, axis=0) / np.sqrt(len(val_accs))
	stderr_train_accs = np.std(train_accs, axis=0) / np.sqrt(
	len(train_accs)
	)
	else:
	sterr_val_losses = np.zeros_like(mean_val_losses)
	stderr_train_losses = np.zeros_like(mean_train_losses)
	sterr_val_accs = np.zeros_like(mean_val_accs)
	stderr_train_accs = np.zeros_like(mean_train_accs)
	run_info[dataset]["val_loss"] = mean_val_losses
	run_info[dataset]["train_loss"] = mean_train_losses
	run_info[dataset]["val_loss_sterr"] = sterr_val_losses
	run_info[dataset]["train_loss_sterr"] = stderr_train_losses
	run_info[dataset]["val_acc"] = mean_val_accs
	run_info[dataset]["train_acc"] = mean_train_accs
	run_info[dataset]["val_acc_sterr"] = sterr_val_accs
	run_info[dataset]["train_acc_sterr"] = stderr_train_accs
	results_info[folder] = run_info

	# CREATE LEGEND -- ADD RUNS HERE THAT WILL BE PLOTTED
	labels = {
	"run_0": "Baselines",
	}


	# Create a programmatic color palette
	def generate_color_palette(n):
	cmap = plt.get_cmap("tab20")
	return [mcolors.rgb2hex(cmap(i)) for i in np.linspace(0, 1, n)]


	# Get the list of runs and generate the color palette
	runs = list(labels.keys())
	colors = generate_color_palette(len(runs))

	# Plot 1: Line plot of training loss for each dataset across the runs with labels
	for dataset in datasets:
	plt.figure(figsize=(10, 6))
	for i, run in enumerate(runs):
	iters = results_info[run][dataset]["step"]
	mean = results_info[run][dataset]["train_loss"]
	sterr = results_info[run][dataset]["train_loss_sterr"]
	plt.plot(iters, mean, label=labels[run], color=colors[i])
	plt.fill_between(iters, mean - sterr, mean + sterr, color=colors[i], alpha=0.2)

	plt.title(f"Training Loss Across Runs for {dataset} Dataset")
	plt.xlabel("Update Steps")
	plt.ylabel("Training Loss")
	plt.legend()
	plt.grid(True, which="both", ls="-", alpha=0.2)
	plt.tight_layout()
	plt.savefig(f"train_loss_{dataset}.png")
	plt.close()

	# Plot 2: Line plot of validation loss for each dataset across the runs with labels
	for dataset in datasets:
	plt.figure(figsize=(10, 6))
	for i, run in enumerate(runs):
	iters = results_info[run][dataset]["step"]
	mean = results_info[run][dataset]["val_loss"]
	sterr = results_info[run][dataset]["val_loss_sterr"]
	plt.plot(iters, mean, label=labels[run], color=colors[i])
	plt.fill_between(iters, mean - sterr, mean + sterr, color=colors[i], alpha=0.2)

	plt.title(f"Validation Loss Across Runs for {dataset} Dataset")
	plt.xlabel("Update Steps")
	plt.ylabel("Validation Loss")
	plt.legend()
	plt.grid(True, which="both", ls="-", alpha=0.2)
	plt.tight_layout()
	plt.savefig(f"val_loss_{dataset}.png")
	plt.close()


	# Plot 3: Line plot of training acc for each dataset across the runs with labels
	for dataset in datasets:
	plt.figure(figsize=(10, 6))
	for i, run in enumerate(runs):
	iters = results_info[run][dataset]["step"]
	mean = results_info[run][dataset]["train_acc"]
	sterr = results_info[run][dataset]["train_acc_sterr"]
	plt.plot(iters, mean, label=labels[run], color=colors[i])
	plt.fill_between(iters, mean - sterr, mean + sterr, color=colors[i], alpha=0.2)

	plt.title(f"Training Accuracy Across Runs for {dataset} Dataset")
	plt.xlabel("Update Steps")
	plt.ylabel("Training Acc")
	plt.legend()
	plt.grid(True, which="both", ls="-", alpha=0.2)
	plt.tight_layout()
	plt.savefig(f"train_acc_{dataset}.png")
	plt.close()

	# Plot 2: Line plot of validation acc for each dataset across the runs with labels
	for dataset in datasets:
	plt.figure(figsize=(10, 6))
	for i, run in enumerate(runs):
	iters = results_info[run][dataset]["step"]
	mean = results_info[run][dataset]["val_acc"]
	sterr = results_info[run][dataset]["val_acc_sterr"]
	plt.plot(iters, mean, label=labels[run], color=colors[i])
	plt.fill_between(iters, mean - sterr, mean + sterr, color=colors[i], alpha=0.2)

	plt.title(f"Validation Loss Across Runs for {dataset} Dataset")
	plt.xlabel("Update Steps")
	plt.ylabel("Validation Acc")
	plt.legend()
	plt.grid(True, which="both", ls="-", alpha=0.2)
	plt.tight_layout()
	plt.savefig(f"val_acc_{dataset}.png")
	plt.close()