置顶文章
精选分类
计算几何
计算机科学随机算法
计算机科学数据分析
计算机科学数据库
计算机科学前端
计算机科学unity
游戏引擎文章列表
lec4 Linear Programming(个人总结版)
首先,讨论了一个现实问题,引入了线性规划相关的知识,即通过一系列的不等式规划出一个区域,然后将目标函数与目标区域的相交点结合,看哪个点最好 # 增量算法 可以首先添加一个简单的且很大的边界,然后将约束条件一次次加入这个区域中,如果最优点 v_i-1 仍然在最新的区域中,那么 v_i=v_i-1,否则重新计算 v_i 复杂度:O(n2)O(n^2)O(n2) 由于每一轮的遍历复杂度都为 O (i),进行 n 个循环 这是最坏的情况,那么如果我们一开始就将最重要的两个限制加入,直接确定了最终的点 v,那么我们的复杂度会非常低,变成 O...
more...期末复习2
lec7 的内容主要在于 区分各种概念,例如机器学习,分类聚类等,然后有几个公式需要记,已经记在 cheatsheet 上了。 apriori 算法 通俗来讲,就是通过所有的频繁的组合都是由单一的频繁项来组成的。比如说,A,B,C,D 四个元素,首先构造一个 min_support , 然后进行迭代,先剪枝掉元素中 k< min_support 的元素,再对剩余元素进行排列组合,最终得到频率最高的组合。 Rule Generation 可以说是枚举法,对所有可能的组合都进行枚举,将组合的所有非空真子集列出来,并将这些候选进行区分。 Efficient Rule...
more...lec3 Convex hulls and the sweepline technique
lec2 中学习的是如何把一个多边形切割开来;而这节课学习的就是,如何把一堆点给包起来 就像你在地上撒了一把钉子,然后用一根橡皮筋把它们围起来,拉紧之后那个形状就是 “凸包”。 所以,构造凸包的这个过程,我们还是从暴力解法开始 朴素暴力解法 我们可以假定一个结论:将点集 S 中的所有点遍历一遍,然后将这些三角形中包住的点都删除;最后剩余的这些没有被包围的点,一定是凸包的顶点。(作为三角形顶点或位于三角形边上的点不被删除) 那么我们就可以 #算法步骤(CH1): 遍历 SSS 中所有可能的三元组 (x,y,z)(x, y, z)(x,y,z):一共...
more...lec7 Principles ofData Science
# 聚类(Clustering) # 一、聚类的概念 聚类是一种 无监督学习方法 目标是:将相似的数据点分在同一个 “簇”(cluster)中 没有预先的标签,完全基于数据之间的 “相似性” 划分 # 二、聚类的用途 文档分组、客户画像、基因数据分析、股票走势分群等 聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法 用于计算两个数据点之间的 “相似程度”(或 “距离”): 距离类型 定义 说明 曼哈顿距离(L1) ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值 欧几里得距离(L2) ( d(i,j)...
more...lec7 Principles ofData Science
# 聚类(Clustering) # 一、聚类的概念 聚类是一种 无监督学习方法 目标是:将相似的数据点分在同一个 “簇”(cluster)中 没有预先的标签,完全基于数据之间的 “相似性” 划分 # 二、聚类的用途 文档分组、客户画像、基因数据分析、股票走势分群等 聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法 用于计算两个数据点之间的 “相似程度”(或 “距离”): 距离类型 定义 说明 曼哈顿距离(L1) ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值 欧几里得距离(L2) ( d(i,j)...
more...lec7 Principles ofData Science
# 聚类(Clustering) # 一、聚类的概念 聚类是一种 无监督学习方法 目标是:将相似的数据点分在同一个 “簇”(cluster)中 没有预先的标签,完全基于数据之间的 “相似性” 划分 # 二、聚类的用途 文档分组、客户画像、基因数据分析、股票走势分群等 聚类可以帮助我们发现数据中的 “自然结构” # 三、相似性度量方法 用于计算两个数据点之间的 “相似程度”(或 “距离”): 距离类型 定义 说明 曼哈顿距离(L1) ( d(i,j) = ∑\sum∑ x_i - x_j ) 抗异常值 欧几里得距离(L2) ( d(i,j)...
more...lec11 Similarity and Simplification(个人总结版)
这一节我们讲的是对比轨迹的相似度 # 相似性度量 # Hausdorff 距离 hausdorff 距离是获取比如 P 和 Q 两个点集的最远的最近点,比如 P->Q,就是从 P 中选择随机一点 p,获取他到 Q 的最近距离,然后在所有 p 点中距离最大的点就是 P->Q 的 Hausdorff 距离。 而两个点集的 Hausdorff 距离就是 P->Q,Q->P 两者中的 max 值 Hausdorff 可以让我们知道两个点集的轨迹相似度,但是他并不能衡量顺序以及其他的,比如两个点集的点完全一样,但是顺序完全不同,Hausdorff...
more...