データ分析

データセットの中央値を見つける

def find_median(dataset):
    sorted_list = sorted(dataset)
    length = len(sorted_list)
    if length % 2 == 0:
        return (sorted_list[length // 2 - 1] + sorted_list[length // 2]) / 2
    else:
        return sorted_list[length // 2]

データセットの分散を計算する

def calculate_variance(data):
    mean = sum(data) / len(data)
    return sum((x - mean) ** 2 for x in data) / len(data)

データセットの標準偏差を計算する

def calculate_std_deviation(data):
    variance = calculate_variance(data)
    return variance ** 0.5

相関係数を計算する

def calculate_correlation(x, y):
    mean_x = sum(x) / len(x)
    mean_y = sum(y) / len(y)
    numerator = sum((xi - mean_x) * (yi - mean_y) for xi, yi in zip(x, y))
    denominator = (sum((xi - mean_x) ** 2 for xi in x) * sum((yi - mean_y) ** 2 for yi in y)) ** 0.5
    return numerator / denominator if denominator else 0