import pandas as pdimport numpy as npimport scipy.stats as statsimport matplotlib.pyplot as pltimport matplotlib.style as stylestyle.use("default")params = {    "axes.labelsize": 8,    "font.size": 8,    "legend.fontsize": 8,    "xtick.labelsize": 8,    "ytick.labelsize": 8,    "text.usetex": False,    "font.family": "sans-serif",    "axes.spines.top": False,    "axes.spines.right": False,    "grid.color": "grey",    "axes.grid": True,    "grid.alpha": 0.5,    "grid.linestyle": ":",}plt.rcParams.update(params)

# Hypothetical test scoresgroup_A = [85, 88, 90, 80, 87, 86, 84, 82, 88, 85, 83, 89, 85, 84, 87]group_B = [87, 93, 92, 90, 95, 91, 92, 90, 93, 91, 94, 95, 92, 91, 94]# Plot test scores of both groupsplt.figure(figsize=(4, 2.5))plt.hist(group_A, alpha=0.5, label='Group A', edgecolor='black')plt.hist(group_B, alpha=0.5, label='Group B', edgecolor='black')plt.xlabel('Test Scores'); plt.ylabel('Frequency'); plt.legend(loc='upper left'); plt.tight_layout(); plt.show()# Two-sample t-testt_stat, p_value = stats.ttest_ind(group_A, group_B)print(f"t-statistic:\t{t_stat:.3f}")print(f"p-value:\t{p_value}")if p_value < 0.05:    print("p < 0.05: The difference between the two groups is significant")else:    print("p > 0.05: The difference between the two groups is not significant")

t-statistic: -7.236p-value: 7.080650095530462e-08p < 0.05: The difference between the two groups is significant

# Define the parameters for the t-distributiondf = 10  # degrees of freedomx = np.linspace(-4, 4, 1000)  # range of x valuesy = stats.t.pdf(x, df)  # probability density function for the t-distributionplt.figure(figsize=(4, 2.5))plt.plot(x, y, label=f'T-distribution (df={df})')plt.title('T-distribution Chart'); plt.xlabel('T-value'); plt.ylabel('Probability Density')plt.legend(); plt.grid(True); plt.tight_layout(); plt.show()

t_value = 2.5df = 10# Define the range of x values for plottingx = np.linspace(-4, 4, 1000)y = stats.t.pdf(x, df)# Calculate the p-value for the given t-value (for a two-tailed test)# This involves finding the area in the tails beyond the t-value and its negative counterpartp_value_area = stats.t.sf(np.abs(t_value), df) * 2  # sf is the survival function, equivalent to 1 - cdfplt.figure(figsize=(4, 2.5))plt.plot(x, y, label=f'T-distribution (df={df})')# Highlight the area corresponding to the p-value# This will be the area in the tails beyond the t-value and its negative counterpartplt.fill_between(x, 0, y, where=(x >= t_value) | (x <= -t_value), color='red', alpha=0.5, label='p-value area')plt.title('T-distribution with p-value Area Highlighted')plt.xlabel('T-value'); plt.ylabel('Probability Density')plt.legend(); plt.grid(True); plt.tight_layout(); plt.show()print(f"p-value:\t{p_value_area}")if p_value_area < 0.05:    print("p < 0.05: Variance is statistically significant")else:    print("p > 0.05: Variance is not statistically significant")

p-value: 0.031446844236608776p < 0.05: Variance is statistically significant

import yfinance as yfstart_year = 2018data = yf.download('SPY', start=f'{start_year}-01-01', end='2023-12-31')data['daily_return'] = data['Adj Close'].pct_change() * 100daily_returns = data['daily_return'].dropna()plt.figure(figsize=(4, 2.5))plt.hist(daily_returns, bins=100, alpha=0.5)plt.title(f'SPY Daily Returns Histogram ({start_year}-2023)')plt.xlabel('Daily Returns (%)'); plt.ylabel('Frequency'); plt.grid(True); plt.tight_layout(); plt.show()

[*********************100%%**********************]  1 of 1 completed

descp_stats = pd.DataFrame(daily_returns.describe())print("Descriptive Statistics for SPY Daily Returns:")descp_stats.round(2)

Descriptive Statistics for SPY Daily Returns:

# QQ plot of SPY daily returnsplt.figure(figsize=(4, 2.5))stats.probplot(daily_returns, dist="norm", plot=plt)plt.title(f'Q-Q Plot of SPY Daily Returns ({start_year} - 2023)'); plt.tight_layout(); plt.show()

shapiro_stat, shapiro_p = stats.shapiro(daily_returns)print(f"Shapiro-Wilk Test for SPY Daily Returns ({start_year} - 2023):")print(    f"W statistic:\t{shapiro_stat:.4f}p-value:\t{shapiro_p}")if shapiro_p < 0.01:    print(f"p < 0.01: data does not originate from normally distributed population")else:    print(f"p < 0.01: data originates from normally distributed population")

Shapiro-Wilk Test for SPY Daily Returns (2018 - 2023):W statistic: 0.8907p-value: 2.156638108052502e-31p < 0.01: data does not originate from normally distributed population

# One-sample t-test on the daily returnst_stat, t_p = stats.ttest_1samp(daily_returns, 0)print(f"One-sample t-test on SPY Daily Returns ({start_year} - 2023):")print(f"t-statistic:\t{t_stat:.4f}p-value:\t{t_p}")

One-sample t-test on SPY Daily Returns (2018 - 2023):t-statistic: 1.5954p-value: 0.11084172033526497

# Calculate total return of SPY over the periodtotal_return = (data['Adj Close'][-1] / data['Adj Close'][0] - 1) * 100print(f"SPY total return (2018 to 2023): {total_return:.2f}%")

SPY total return (2018 to 2023): 95.54%

# Crawl list of SP100 constituents from Wikipediaimport requestsresponse = requests.get( "https://en.wikipedia.org/wiki/S%26P_100")tables = pd.read_html(response.text)sp100 = tables[2]sp100['Symbol'] = sp100['Symbol'].str.replace(".", "-")sp100

import yfinance as yfticker_list = sp100['Symbol'].to_list()ticker_list.append('SPY')start_year = 2018price_data = yf.download(ticker_list, start=f'{start_year}-01-01', end='2023-12-31')price_data_daily_returns = price_data['Adj Close'].pct_change().dropna() * 100

[*********************100%%**********************]  102 of 102 completed

fig, ax = plt.subplots(3, 2, figsize=(6, 6))for i, stock in enumerate(['SPY', 'AAPL', 'WMT']):    left, right = ax[i]    left.hist(price_data_daily_returns[stock], bins=100, alpha=0.5)    stats.probplot(price_data_daily_returns[stock], dist="norm", plot=right)    right.get_lines()[0].set_markersize(2.0); right.get_lines()[0].set_color('tab:blue')    left.set_title(f'{stock} - Daily Returns'); right.set_title(f'{stock} - Q-Q Plot')    left.set_ylabel('Frequency'); left.set_xlabel('Daily Returns (%)')fig.suptitle(f'Daily Returns Histogram & Q-Q Plots ({start_year}-2023)', y=1.0)plt.tight_layout(); plt.show()

aapl_daily_returns = price_data_daily_returns["AAPL"]wmt_daily_returns = price_data_daily_returns["WMT"]# Levene's test for equal varianceslevene_stat, levene_p = stats.levene(aapl_daily_returns, wmt_daily_returns)print("Levene's Test for Equal Variances:")print(f"test statistic:\t{levene_stat:.3f}p-value:\t{levene_p}")if levene_p < 0.01:    print(f"p < 0.01: variances are significantly different.")    print(f"Interpretation: Use non-parametric tests or Welch's t-test for unequal variances")else:    print(f"p > 0.01: variances are equal")    print(f"Interpretation: Use parametric tests for equal variances")

Levene's Test for Equal Variances:test statistic: 106.564p-value: 1.7836047743809876e-24p < 0.01: variances are significantly different.Interpretation: Use non-parametric tests or Welch's t-test for unequal variances

# Conducting an F-test for equal variancesvar_original = np.var(aapl_daily_returns, ddof=1)var_cloned = np.var(wmt_daily_returns, ddof=1)F = var_original / var_cloneddf1 = len(aapl_daily_returns) - 1  # degrees of freedom for the first sampledf2 = len(wmt_daily_returns) - 1  # degrees of freedom for the second sampleF_p_value = (    1 - stats.f.cdf(F, df1, df2)    if var_original > var_cloned    else stats.f.cdf(F, df1, df2))print("F-test for Equal Variances:")print(f"test statistic:\t{F:.3f}p-value:\t{F_p_value}")if F_p_value < 0.01:    print(f"p < 0.01: variances are significantly different")    print(f"Interpretation: Use non-parametric tests or Welch's t-test for unequal variances")else:    print(f"p > 0.01: variances are equal")    print(f"Interpretation: Use parametric tests for equal variances")

F-test for Equal Variances:test statistic: 2.075p-value: 1.1102230246251565e-16p < 0.01: variances are significantly differentInterpretation: Use non-parametric tests or Welch's t-test for unequal variances

# Set equal_var=False to indicate that we do not assume equal population variancest_stat, p_value = stats.ttest_ind(aapl_daily_returns, wmt_daily_returns, equal_var=False)print("Welch's t-test for AAPL and WMT Daily Returns:")print(f"t-statistic:\t{t_stat:,.3f}p-value:\t{p_value:.6f}1")if p_value < 0.01:    print(f"p < 0.01: distributions are significantly different")else:    print(f"p > 0.01: distributions are not significantly different")

Welch's t-test for AAPL and WMT Daily Returns:t-statistic: 1.201p-value: 0.2300541p > 0.01: distributions are not significantly different

# Mann-Whitney U test# The alternative parameter specifies the hypothesis to test; 'two-sided' tests the hypothesis# that the distributions are different (not specifying whether one is greater than the other).# If you have a directional hypothesis, you can use 'greater' or 'less' instead.u_statistic, p_value = stats.mannwhitneyu(    aapl_daily_returns, wmt_daily_returns, alternative="two-sided")print("Mann-Whitney U Test for AAPL and WMT Daily Returns:")print(f"t-statistic:\t{u_statistic:,.3f}p-value:\t{p_value:.6f}1")if p_value < 0.01:    print(f"p < 0.01: distributions are significantly different")else:    print(f"p > 0.01: distributions are not significantly different")

Mann-Whitney U Test for AAPL and WMT Daily Returns:t-statistic: 752,986.000p-value: 0.0985831p > 0.01: distributions are not significantly different

# Calculate AAPL total return and WMT total returnaapl_total_return = (price_data['Adj Close']['AAPL'][-1] / price_data['Adj Close']['AAPL'][0] - 1) * 100wmt_total_return = (price_data['Adj Close']['WMT'][-1] / price_data['Adj Close']['WMT'][0] - 1) * 100print(f"AAPL total return (2018 to 2023): {aapl_total_return:.2f}%")print(f"WMT total return (2018 to 2023): {wmt_total_return:.2f}%")

AAPL total return (2018 to 2023): 372.78%WMT total return (2018 to 2023): 77.89%

# Calculate Pearson's correlation coefficientcorrelation_coefficient, p_value = stats.pearsonr(aapl_daily_returns, wmt_daily_returns)print("Pearson's Correlation Coefficient for AAPL & WMT Daily Returns:")print(f"r:\t\t{correlation_coefficient:.3f}p-value:\t{p_value}")

Pearson's Correlation Coefficient for AAPL & WMT Daily Returns:r:  0.390p-value: 4.503405572247887e-45

# Filter price_data_daily_returns to only include 5 stocks for each sector in SP100sectors = sp100['Sector'].unique()sector_stocks = []for sector in sectors:    sector_stocks.extend(sp100[sp100['Sector'] == sector]['Symbol'].to_list()[:5])price_data_daily_returns_sector = price_data_daily_returns[sector_stocks]

import seaborn as snspearson_correlation_matrix = price_data_daily_returns_sector.corr(method='pearson')plt.figure(figsize=(9, 7))sns.heatmap(pearson_correlation_matrix, annot=False, cmap='coolwarm', cbar=True)plt.title("Pearson's Correlation Matrix for Daily Stock Returns")plt.yticks(rotation=0); plt.tight_layout(); plt.show()

# Calculate Spearman's rank correlation coefficientrank_correlation_coefficient, rank_p_value = stats.spearmanr(aapl_daily_returns, wmt_daily_returns)print("Spearman's Rank Correlation Coefficient for AAPL & WMT Daily Returns:")print(f"r:\t\t{rank_correlation_coefficient:.3f}p-value:\t{rank_p_value}")

Spearman's Rank Correlation Coefficient for AAPL & WMT Daily Returns:r:  0.315p-value: 4.3214224570231754e-29

spearman_correlation_matrix = price_data_daily_returns_sector.corr(method='spearman')plt.figure(figsize=(9, 7))sns.heatmap(spearman_correlation_matrix, annot=False, cmap='coolwarm', cbar=True)plt.title("Spearman's Rank Correlation Matrix for Daily Stock Returns")plt.yticks(rotation=0); plt.tight_layout(); plt.show()

	daily_return
count	1508.00
mean	0.05
std	1.28
min	-10.94
25%	-0.49
50%	0.08
75%	0.69
max	9.06

	Symbol	Name	Sector
0	AAPL	Apple	Information Technology
1	ABBV	AbbVie	Health Care
2	ABT	Abbott	Health Care
3	ACN	Accenture	Information Technology
4	ADBE	Adobe	Information Technology
...	...	...	...
96	V	Visa	Information Technology
97	VZ	Verizon	Communication Services
98	WFC	Wells Fargo	Financials
99	WMT	Walmart	Consumer Staples
100	XOM	ExxonMobil	Energy

Testing Statistical Significance in Financial Data with Python

Parametric vs Non-Parametric Tests

How to choose a statistical test

Simple Example of a Statistical Significance Test (T-Test)

T-Distribution Chart

p-value explained

Null Hypothesis and Rejecting It

Normality Test

Histogram

Q-Q Plot

Shapiro-Wilk Test

Equal Variance

Daily Stock Returns of SP100 Companies

Levene's Test

F-Test

Statistical Tests

Welcht's t-test

Mann-Whitney U Test

Correlations

Pearson Correlation

Spearman's Rank Correlation