博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[数据分析学习笔记] 数据挖掘建模过程
阅读量:4041 次
发布时间:2019-05-24

本文共 702 字,大约阅读时间需要 2 分钟。

数据挖掘建模过程

1. 确定数据挖掘的目标

2. 数据取样

3. 数据整理

4. 构建数据模型

5. 模型评价

6. 模型应用


1. 确定数据挖掘的目标

针对具体的数据挖掘应用需求,首先要确定本次数据挖掘的目标是什么?系统完成之后能够达到什么样的效果?

要想充分发挥数据挖掘的价值,必须对目标有一个清晰明确的定义,即决定到底想干什么?

 


2. 数据取样

在明确了需要进行数据挖掘的目标之后,接下来就需要从业务系统中抽取一个与挖掘目标相关的样本数据子集。

抽取数据的标准,一是相关性;二是可靠性;三是有效性。

在抽取数据时,还需要关注数据的质量。

衡量数据取样质量的标准如下:

(1)数据完整,无缺,各类指标项齐全;

(2)数据准确无误,反映的都是正常(而不是异常)状态下的水平。

抽样的方式:

  •  随机抽样
  •  等距抽样
  •  分层抽样
  •  从起始顺序抽样
  •  分类抽样

 


3. 数据整理

对所抽取的样本数据进行探索、审核和必要的加工处理,是保证最终的挖掘模型的质量所必须的。

数据探索主要包括:

(1)异常值分析

          

(2)缺失值分析

(3)相关性分析

(4)周期性分析

 


4. 构建数据模型

构建数据模型是数据挖掘过程的核心环节。

根据挖掘目标和数据形式可以建立:

(1)分类与预测模型

(2)聚类分析模型

(3)关联规则模型

(4)时序模式

(5)偏差检测模型

通过各种模型帮助企业提取数据中蕴含的商业价值,提高企业的竞争力。

 


5. 模型评价

构建模型过程中,会得出一系列的分析结果,模型评价的目的之一就是从这些模型中自动找出一个最好的模型,另外就是要根据业务对模型进行解释和应用。


6. 模型应用

将模型进行应用

对模型进行重构

 

转载地址:http://xsvdi.baihongyu.com/

你可能感兴趣的文章
mysql:sql create database新建utf8mb4 数据库
查看>>
mysql:sql alter database修改数据库字符集
查看>>
mysql:sql drop table (删除表)
查看>>
mysql:sql truncate (清除表数据)
查看>>
scrapy:xpath string(.)非常注意问题
查看>>
yuv to rgb 转换失败呀。天呀。谁来帮帮我呀。
查看>>
yuv420 format
查看>>
YUV420只绘制Y通道
查看>>
yuv420 还原为RGB图像
查看>>
LED恒流驱动芯片
查看>>
驱动TFT要SDRAM做为显示缓存
查看>>
使用file查看可执行文件的平台性,x86 or arm ?
查看>>
qt5 everywhere 编译summary
查看>>
qt5 everywhere编译完成后,找不到qmake
查看>>
arm-linux开机读取硬件时钟,设置系统时钟。
查看>>
交叉编译在x86上调试好的qt程序
查看>>
qt 创建异形窗体
查看>>
可重入函数与不可重入函数
查看>>
简单Linux C线程池
查看>>
内存池
查看>>