数学与统计计算：Python math 与 statistics库基础教程

标签：statistics 计算 Python 基础教程 print data math mean

数学与统计计算：Python `math` 与 `statistics` 库基础教程

在数据分析、机器学习和科学计算中，数学和统计学是两个至关重要的基础。Python 提供了强大的内置库 math 和 statistics，可以帮助我们快速、方便地完成常见的数学和统计计算。本篇博客将介绍 math 和 statistics 库中的基础函数，并提供一些实际应用示例，帮助您掌握这些工具的使用。

一、`math` 库基础

math 库是 Python 内置的数学函数库，提供了丰富的数学计算功能，如基本的代数运算、三角函数、对数和指数运算等。以下是 math 库中一些常用函数的介绍：

1. 基本数学函数

求绝对值：`math.fabs(x)`

返回 x 的绝对值（浮点数）。

import math

print(math.fabs(-10))  # 输出：10.0

四舍五入：`math.ceil(x)` 和 `math.floor(x)`

math.ceil(x)：返回大于等于 x 的最小整数。
math.floor(x)：返回小于等于 x 的最大整数。

print(math.ceil(4.3))  # 输出：5
print(math.floor(4.7)) # 输出：4

幂次方和平方根：`math.pow(x, y)` 和 `math.sqrt(x)`

math.pow(x, y)：计算 x 的 y 次幂。
math.sqrt(x)：计算 x 的平方根。

print(math.pow(2, 3))  # 输出：8.0
print(math.sqrt(16))   # 输出：4.0

2. 对数和指数函数

自然对数和常用对数：`math.log(x)` 和 `math.log10(x)`

math.log(x)：计算 x 的自然对数（以 e 为底）。
math.log10(x)：计算 x 的常用对数（以 10 为底）。

print(math.log(2.7183))  # 输出：约等于 1
print(math.log10(100))   # 输出：2

指数函数：`math.exp(x)`

math.exp(x)：计算 e^x，其中 e 为自然常数（约等于 2.718）。

print(math.exp(1))  # 输出：2.718...

3. 三角函数

math 库提供了常用的三角函数，比如 sin、cos 和 tan，它们的参数和返回值均为弧度制。如果需要将角度制转换为弧度制，可以使用 math.radians()。

angle = 45
radian = math.radians(angle)
print(math.sin(radian))  # 输出：0.707...
print(math.cos(radian))  # 输出：0.707...

二、`statistics` 库基础

statistics 库提供了 Python 内置的统计函数，适合数据分析中常见的统计计算。接下来介绍一些常用的统计函数。

1. 求均值：`statistics.mean(data)`

返回数据集的平均值（均值）。

import statistics

data = [1, 2, 3, 4, 5]
print(statistics.mean(data))  # 输出：3

2. 求中位数：`statistics.median(data)`

返回数据集的中位数，适合数据集含有极值时使用。

print(statistics.median(data))  # 输出：3

3. 求众数：`statistics.mode(data)`

返回数据集中出现次数最多的值（众数）。如果数据集中有多个众数，该函数将返回第一个找到的众数。

data = [1, 1, 2, 3, 4]
print(statistics.mode(data))  # 输出：1

4. 求方差和标准差：`statistics.variance(data)` 和 `statistics.stdev(data)`

statistics.variance(data)：返回数据集的样本方差。
statistics.stdev(data)：返回数据集的样本标准差。

print(statistics.variance(data))  # 输出：约 1.58
print(statistics.stdev(data))     # 输出：约 1.26

三、实用示例

示例 1：计算两个数的欧几里得距离

在二维空间中计算点 (x1, y1) 和 (x2, y2) 的欧几里得距离：

import math

def euclidean_distance(x1, y1, x2, y2):
    return math.sqrt(math.pow(x2 - x1, 2) + math.pow(y2 - y1, 2))

print(euclidean_distance(1, 2, 4, 6))  # 输出：5.0

示例 2：统计分析一组数据的特征

分析一组分数数据，包括均值、中位数、方差和标准差：

import statistics

scores = [55, 80, 75, 90, 85, 70, 65, 95]

mean = statistics.mean(scores)
median = statistics.median(scores)
variance = statistics.variance(scores)
stdev = statistics.stdev(scores)

print(f"均值: {mean}")
print(f"中位数: {median}")
print(f"方差: {variance}")
print(f"标准差: {stdev}")

示例 3：使用 `math` 和 `statistics` 库生成正态分布模拟

生成一个符合正态分布的随机数据，并计算其统计特征：

import random

# 生成 100 个均值为 0，标准差为 1 的正态分布数据
data = [random.gauss(0, 1) for _ in range(100)]

# 计算统计特征
mean = statistics.mean(data)
stdev = statistics.stdev(data)

print(f"生成数据的均值: {mean}")
print(f"生成数据的标准差: {stdev}")

建议

通过 math 和 statistics 库，我们可以快速完成基础的数学和统计计算，这对数据分析和科学计算都非常有帮助。无论是基本的数学运算还是统计特征计算，Python 内置的这些函数都能满足大多数需求。掌握这些函数的使用，可以大大提高您的代码效率和计算能力。

示例 4：计算房价数据的标准分数 (Z-score)

标准分数（Z-score）是表示数据点与均值的偏离程度。Z-score 的计算公式为：
[
Z = \frac{X - \mu}{\sigma}
]
其中 ( X ) 是数据点，( \mu ) 是数据的均值，( \sigma ) 是标准差。我们可以利用 statistics 库中的均值和标准差函数来计算 Z-score。

import statistics

# 假设有一组房价数据
house_prices = [200000, 210000, 250000, 270000, 300000, 320000, 350000]

# 计算均值和标准差
mean_price = statistics.mean(house_prices)
stdev_price = statistics.stdev(house_prices)

# 计算每个房价的 Z-score
z_scores = [(price - mean_price) / stdev_price for price in house_prices]

print("房价的 Z-score 分数:", z_scores)

Z-score 帮助我们识别在一组数据中偏离均值较远的值，是数据标准化的重要步骤。

示例 5：投资回报率的年化计算

在金融领域，经常会计算投资的年化回报率。假设我们有每月的投资回报率数据，可以用 math 库计算年化收益率：

[
\text{年化回报率} = (1 + \text{平均月回报率})^{12} - 1
]

import math
import statistics

# 假设有一组每月的投资回报率数据（例如每月回报率为 0.02 表示 2%）
monthly_returns = [0.02, 0.015, 0.03, 0.025, 0.01, 0.02, 0.018, 0.03, 0.025, 0.015, 0.02, 0.03]

# 计算平均月回报率
mean_monthly_return = statistics.mean(monthly_returns)

# 计算年化回报率
annual_return = math.pow(1 + mean_monthly_return, 12) - 1
print(f"年化回报率: {annual_return:.2%}")

这里，.2% 的格式化表示输出保留两位小数并以百分比形式显示。年化回报率的计算对长期投资分析具有重要意义。

示例 6：创建简单的线性回归模型

线性回归用于拟合数据的趋势，并通过拟合的线性方程预测新的数据点。我们可以利用 statistics.mean() 和基础代数来实现简单的线性回归模型。

假设有一组数据，其中 x 是年份，y 是某公司的收入。

import statistics

# 样本数据
years = [1, 2, 3, 4, 5]
revenue = [100, 150, 200, 250, 300]

# 计算均值
mean_x = statistics.mean(years)
mean_y = statistics.mean(revenue)

# 计算斜率 (slope) 和截距 (intercept)
numerator = sum((x - mean_x) * (y - mean_y) for x, y in zip(years, revenue))
denominator = sum((x - mean_x) ** 2 for x in years)
slope = numerator / denominator
intercept = mean_y - slope * mean_x

print(f"线性回归方程: y = {slope:.2f}x + {intercept:.2f}")

# 使用线性回归预测第 6 年的收入
year_6_prediction = slope * 6 + intercept
print(f"第 6 年预测收入: {year_6_prediction:.2f}")

在这里，我们通过计算斜率和截距拟合出一条最佳直线，并用这条直线预测未来的值。这种简单的线性回归在数据趋势分析中非常有用。

结语

Python 的 math 和 statistics 库提供了丰富的函数，可以帮助我们快速完成数学和统计分析。无论是基本的代数运算、三角计算，还是统计特征的提取和分析，这两个库都具备高效实用的功能。

希望本教程能帮助您熟悉 math 和 statistics 库，为后续的数据处理和分析打下基础。

标签：statistics,计算,Python,基础教程,print,data,math,mean
From： https://blog.csdn.net/liaoqingjian/article/details/143692156

数学与统计计算：Python math 与 statistics库基础教程