中国统计网

登录

首页

分类浏览

专题

专栏作者

问答

线下活动

企业招聘

app下载

投稿

注册




一起聊聊数据分析师的那些技能(硬功夫)
数据分析告诉你游戏公司是如何运作的
机器学习开篇
中国统计网找数据分析兼职讲师了

根据公式,其实你可以看到WOE考虑了一个变量的3个方面:响应率(%Success), 不响应率(%Unsuccess)以及样本量(你可以说是coverage,也可以说是变量里面每个组,bin,的样本分布)。而通常在我们进行univariate Analysis来观察变量是否显著的时候,大多数时间会用Proc freq看个chi-square test去看一个变量是否显著,或者说有区分度。但这种方法往往只考虑了响应率。……

在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随机的划分为K份数据子集。本文介绍SAS的SURVEYSELECT过程和RANUNI函数在随机抽样方面的应用。……

郑来轶 数据仓库 2016-01-31 0

在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随机的划分为K份数据子集。本文介绍SAS的SURVEYSELECT过程和RANUNI函数在随机抽样方面的应用。……

日历图是在日常工作中非常有用的一种数据可视化展示,它非常适合于展示随着日期变化的动态数据,以便于视觉化的发现有规律的时间序列现象,从而方便的定位问题和机遇。 在SAS里画出这样的日历图并不困难。先使用proc gmap画出日历,再用根据数据进行颜色编码即可。……

未知 数据仓库 2016-01-30 0

在上一篇SAS算法中,介绍了什么是最小生成树,介绍了Kruskal算法。这篇介绍一下关于欧拉回路的算法:Fleury算法。……

未知 数据仓库 2016-01-30 0

在第一篇SAS算法中,介绍了什么是最短路径,介绍了Dijkstra算法,这一篇我想介绍一下如何用SAS写最小生成树算法:Kruskal算法。……

未知 数据仓库 2016-01-30 0
热点资讯
专栏作者
  • 数据小兵
    统计网特邀认证作者
    数据分析知名博主,SPSS自学教练,博客www.datasoldier.net
  • 黄成明
    统计网特邀认证作者
    黄成明 ,零售数据分析研究者,拥有15年的销售及数据分析经验,历经美国强生公司、妮维雅公司、雅芳公司和鼎盛时期的诺基亚公司。目前是数据化管理的咨询顾问和培训师。他独立研发了基于周销售权重指数的零售管理模型,可以有效地进行目标管理、销售预测、客流预估、促销评估、销售预警等。
  • 傅一平
    统计网特邀认证作者
    浙江移动大数据中心 数据管理部经理 博士 毕业于浙江大学 10多年数据从业经验,专注于大数据采集、处理、建模、管理、变现及产业等研究
  • 秦路
    统计网特邀认证作者
版权所有: 统计网. Copyright © 2016 itongji.cn All Rights Reserved. 备案号:ICP备15042641号-3