# week1 不考?
# 2. week2
# 2.1 数据类型
- Nominal 定类数据
只有数据类型,没有其他的
比如 ID number,性别 - Ordinal 定序数据
在 Nominal 的基础上可以进行排序
例如辣度,电影评分等 - Interval 定距数据
在 Ordinal 的基础上,可以对数据进行加减计算
例如温度,年份等, - Ratio 定比数据
有了乘除的操作,有绝对 0 的定义
例如质量,长度等
# 2.2 统计概念
- Mode(众数):出现频率最高的值。
- Median(中位数):排序后中间的值。
- Min(最小值):所有值的平均数。
可能会考一个计算题,让算中位数,众数,方差等等
会问数据类型,问使用什么图表
方差计算公式:
- 使用
N-1
作为分母 - 公式为:
(每个值 - 平均值)²的总和 / (样本数量 - 1)
- 使用
百分位数(percentile)计算:
ItemAtIndex0.1 * n
,其中n
为样本数量。
范围(range):
maximum - minimum
四分位间距(IQR):
Q3 - Q1
标准差:根号方差
# week3
把第三周的 ppt 都看一遍,把每个 plot 理解并记住名字,不需要代码,但是需要直到名字
# week6
# 1. 研究类型
# 1.1 Observational study
作为观察者,只观察发生了什么,没有控制变量
- 研究者是被动的旁观者。
- 记录信息而不施加任何控制变量。
- 只能证明变量之间存在关联关系,但不能证明因果关系。
# 1.2 Experimental Study
在观察的同时,还会进行一些干涉并限定研究条件。
- 研究者是积极参与者。
- 需要先建立合理的假设。
- 旨在建立因果关系。