# 多样项集

## **多等级频繁项集**

比如在level 1中牛奶的支持度为0.1，level 2中脱脂牛奶为0.02，非脱脂牛奶为0.06

一般用最小的min-support传递给下一次level来解决

## 多维度频繁项集

![](https://686859917-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LK1Q5wVABDXPa7Mueaw%2F-LOWPBcQNuefwjesuDir%2F-LOWQHMi2B642bKNW376%2FTimLine%E6%88%AA%E5%9B%BE20181011124027.png?alt=media\&token=2d2a554d-becd-43ba-bef3-9eeae2bc395f)

## 数值关联挖掘

比如年龄与薪水，两个数值型数据同时出现的相关问题的讨论

1、基于预分层级的静态离散分析：数据立方聚合

2、基于数据分布的动态离散分析

3、聚类：每个维度聚类，再相关联

4、偏差分析：性别(女)->薪水(均值$7/hr(两性一共$9/hr))

## **稀有模式与**负模式挖掘

**稀有模式：**&#x6709;一些项集支持度非常低(比如买很贵的手表交易在所有订单中)

**负模式：**&#x4E0D;太可能同时出现的模式(限牌，一顾客同时买两辆汽车) $$sup(A\cup B) \ll sup(A)\times sup(B)$$&#x20;

## 压缩及低冗余项集挖掘

**压缩数据：**&#x20;

![](https://686859917-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LK1Q5wVABDXPa7Mueaw%2F-LOWQvg3NMIQz2v0lE2T%2F-LOWTdV6lEGxoKTLz46K%2FTimLine%E6%88%AA%E5%9B%BE20181011125434.png?alt=media\&token=56aa225f-cd82-4a7e-a681-1cd4c455ef2c)

**低冗余：**

![](https://686859917-files.gitbook.io/~/files/v0/b/gitbook-legacy-files/o/assets%2F-LK1Q5wVABDXPa7Mueaw%2F-LOWQvg3NMIQz2v0lE2T%2F-LOWU1y80c1S9qEp25hS%2FTimLine%E6%88%AA%E5%9B%BE20181011125651.png?alt=media\&token=41de0d5c-00a3-4c55-9d8c-298baaad192d)

##
