QzmVc1

Standing on Shoulders of Giants.

0%

前言

针对协同过滤算法的头部效应较明显、泛化能力较弱的问题,矩阵分解算法被提出。矩阵分解在协同过滤算法中“共现矩阵”的基础上,加入了隐向量的概念,加强了模型处理稀疏矩阵的能力,针对性地解决了协同过滤存在的主要问题。

阅读全文 »

一、什么是协同过滤?

顾名思义,“协同过滤”就是协同大家的反馈、评价和意见一起对海量的信息进行过滤,从中筛选出目标用户可能感兴趣的信息的推荐过程。其主要分为:

  • 基于用户相似度进行推荐的协同过滤算法(\(UserCF\)
  • 基于物品相似度进行推荐的协同过滤算法(\(ItemCF\)
阅读全文 »

引言

CART(Classification and Regression Tree),又名分类回归树,是在ID3的基础上进行优化的决策树,CART有以下几个关键点:

  1. CART既能是分类树,又能是回归树;
  2. 当CART是分类树时,采用Gini值作为节点分裂的依据;当CART是回归树时,采用样本的最小方差作为节点分裂的依据;
  3. CART是一棵二叉树
阅读全文 »

引言

粒子群算法源于复杂适应系统(Complex Adaptive System, CAS)。CAS理论于1994年正式提出,CAS中的成员称为主体。比如研究鸟群系统,每个鸟在这个系统中就称为主体。主体有适应性,它能够与环境及其他的主体进行交流,并且根据交流的过程“学习”或“积累经验”改变自身结构与行为。整个系统的演变或进化包括:新层次的产生(小鸟的出生);分化和多样性的出现(鸟群中的鸟分成许多小的群);新的主题的出现(鸟寻找食物过程中,不断发现新的食物)。

所以CAS系统中的主体具有4个基本特点(这些特点是粒子群算法发展变化的依据):

  • 首先,主体是主动的、活动的。
  • 主体与环境及其他主体是相互影响、相互作用的,这种影响是系统发展变化的主要动力。
  • 环境的影响是宏观的,主体之间的影响是微观的,宏观与微观要有机结合。
  • 最后,整个系统可能还要受一些随机因素的影响。

粒子群算法就是对一个CAS系统---鸟群社会系统的研究得出的。

阅读全文 »

引言

在学习奇异值分解前,请务必看一下以下对于奇异值的直观理解:奇异值的物理意义是什么?

奇异值分解是一种矩阵因子分解方法,任意一个 \(m×n\) 矩阵,都可以表示为三个矩阵的乘积(因子分解)形式,分别是 \(m\) 阶正交矩阵、由降序排列的非负的对角线元素组成的 \(m×n\) 矩阵对角矩阵和 \(n\) 阶正交矩阵,称为该矩阵的奇异值分解。矩阵的奇异值分解一定存在,但不唯一。奇异值分解可以看作是矩阵数据压缩的一种方法,即用因子分解的方式近似地表示原始矩阵,这种近似是在平方损失意义下的最有近似。

阅读全文 »