IRON = 杂项笔记

2025-06-12

lec5 Range Searching 1

2025-06-07

lec4 Linear Programming(个人总结版)

首先，讨论了一个现实问题，引入了线性规划相关的知识，即通过一系列的不等式规划出一个区域，然后将目标函数与目标区域的相交点结合，看哪个点最好 # 增量算法可以首先添加一个简单的且很大的边界，然后将约束条件一次次加入这个区域中，如果最优点 v_i-1 仍然在最新的区域中，那么 v_i=v_i-1，否则重新计算 v_i 复杂度：O(n2)O(n^2)O(n2) 由于每一轮的遍历复杂度都为 O (i)，进行 n 个循环这是最坏的情况，那么如果我们一开始就将最重要的两个限制加入，直接确定了最终的点 v，那么我们的复杂度会非常低，变成 O...

more...

2025-06-06

期末复习2

lec7 的内容主要在于区分各种概念，例如机器学习，分类聚类等，然后有几个公式需要记，已经记在 cheatsheet 上了。 apriori 算法通俗来讲，就是通过所有的频繁的组合都是由单一的频繁项来组成的。比如说，A,B,C,D 四个元素，首先构造一个 min_support , 然后进行迭代，先剪枝掉元素中 k< min_support 的元素，再对剩余元素进行排列组合，最终得到频率最高的组合。 Rule Generation 可以说是枚举法，对所有可能的组合都进行枚举，将组合的所有非空真子集列出来，并将这些候选进行区分。 Efficient Rule...

more...

2025-06-03

lec3 Convex hulls and the sweepline technique

lec2 中学习的是如何把一个多边形切割开来；而这节课学习的就是，如何把一堆点给包起来就像你在地上撒了一把钉子，然后用一根橡皮筋把它们围起来，拉紧之后那个形状就是 “凸包”。所以，构造凸包的这个过程，我们还是从暴力解法开始朴素暴力解法我们可以假定一个结论：将点集 S 中的所有点遍历一遍，然后将这些三角形中包住的点都删除；最后剩余的这些没有被包围的点，一定是凸包的顶点。(作为三角形顶点或位于三角形边上的点不被删除) 那么我们就可以 #算法步骤（CH1）：遍历 SSS 中所有可能的三元组 (x,y,z)(x, y, z)(x,y,z)：一共...

more...

2025-06-02

lec7 Principles ofData Science

# 聚类（Clustering) # 一、聚类的概念聚类是一种无监督学习方法目标是：将相似的数据点分在同一个 “簇”（cluster）中没有预先的标签，完全基于数据之间的 “相似性” 划分 # 二、聚类的用途文档分组、客户画像、基因数据分析、股票走势分群等聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法用于计算两个数据点之间的 “相似程度”（或 “距离”）：距离类型定义说明曼哈顿距离（L1） ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值欧几里得距离（L2） ( d(i,j)...

more...

2025-06-02

lec7 Principles ofData Science

# 聚类（Clustering) # 一、聚类的概念聚类是一种无监督学习方法目标是：将相似的数据点分在同一个 “簇”（cluster）中没有预先的标签，完全基于数据之间的 “相似性” 划分 # 二、聚类的用途文档分组、客户画像、基因数据分析、股票走势分群等聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法用于计算两个数据点之间的 “相似程度”（或 “距离”）：距离类型定义说明曼哈顿距离（L1） ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值欧几里得距离（L2） ( d(i,j)...

more...

2025-06-02

lec7 Principles ofData Science

# 聚类（Clustering) # 一、聚类的概念聚类是一种无监督学习方法目标是：将相似的数据点分在同一个 “簇”（cluster）中没有预先的标签，完全基于数据之间的 “相似性” 划分 # 二、聚类的用途文档分组、客户画像、基因数据分析、股票走势分群等聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法用于计算两个数据点之间的 “相似程度”（或 “距离”）：距离类型定义说明曼哈顿距离（L1） ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值欧几里得距离（L2） ( d(i,j)...

more...

2025-06-02

期末复习1

# week1 不考？ # 2. week2 # 2.1 数据类型 Nominal 定类数据只有数据类型，没有其他的比如 ID number，性别 Ordinal 定序数据在 Nominal 的基础上可以进行排序例如辣度，电影评分等 Interval 定距数据在 Ordinal 的基础上，可以对数据进行加减计算例如温度，年份等， Ratio 定比数据有了乘除的操作，有绝对 0 的定义例如质量，长度等 # 2.2...

more...

2025-05-30

未命名

5.31 5270 lec2 5045 lec1 6.1 5270 lec 3 5310 期末 1 6.2 5270 lec 4 5045 lec 2 6.3 5270 lec 5 5310 期末 2 6.4 5045 lec2 5992 期末 2 6.5 5045 lec 3 5310 期末 3 6.6 5992 期末 3 5045 lec 4 6.7 5310 期末 4 5992 期末 4 6.8 5310 期末 5 5992 期末 5 6.9 5310 5992 最后一轮复习 6.12 5270 lec 6 5045

more...

2025-05-27

lec11 Similarity and Simplification(个人总结版)

这一节我们讲的是对比轨迹的相似度 # 相似性度量 # Hausdorff 距离 hausdorff 距离是获取比如 P 和 Q 两个点集的最远的最近点，比如 P->Q，就是从 P 中选择随机一点 p，获取他到 Q 的最近距离，然后在所有 p 点中距离最大的点就是 P->Q 的 Hausdorff 距离。而两个点集的 Hausdorff 距离就是 P->Q,Q->P 两者中的 max 值 Hausdorff 可以让我们知道两个点集的轨迹相似度，但是他并不能衡量顺序以及其他的，比如两个点集的点完全一样，但是顺序完全不同，Hausdorff...

more...

杂项笔记

置顶文章

基础操作

精选分类

计算几何

随机算法

数据分析

数据库

前端

unity

文章列表

lec5 Range Searching 1

lec4 Linear Programming(个人总结版)

期末复习2

lec3 Convex hulls and the sweepline technique

lec7 Principles ofData Science

lec7 Principles ofData Science

lec7 Principles ofData Science

期末复习1

未命名

lec11 Similarity and Simplification(个人总结版)