中国统计网

登录

首页

分类浏览

专题

专栏作者

问答

线下活动

企业招聘

app下载

投稿

注册




二元逻辑回归

数据有3万多个变量,做二元逻辑回归出现下列警告,如何解决

警告

没有足够的内存可供运行该命令。 对活动变量和转换使用动态内存。 使用更多内存重新运行,或尝试运行 /EXTERNAL 子命令。

停止执行该命令。

0
2017-01-11 11:11 回答
如果计算资源不够,那当然是做数据预处理啊①做变量选择,剔除无关或者“不重要”的变量,这种“不重要”表现为该变量对预测目标帮助不大,无监督的变量选择有方差法,比如某个变量的方差很小,说明这个变量包含的信息少,对于区分类别或回归预测没啥用,可以剔除,也有一些监督的变量选择方法,可以百度了解,关键是在变量选择时你没必要所有变量一起进行,所以不用担心内存不足,你可以把变量数目控制在一个上限,当你选择完成,这个变量上限没让内存不足,同时你删选后的变量也更“优”;②做降维处理,比如pca,ica,降维可以单独做,也可以在①的基础上做
回复(0)
0
2017-01-10 16:44 回答
如果你的这个模型是3万多个变量,我觉得吧。你能不能把变量先缩减到百个以内吧!我估计你这个3万多个变量,再加上几十万行的话,这个计算复杂度是指数级的。
如果你是3万多行,报内存不足,那我觉得你是不是可以放到服务器上算?
回复(0)
0
2017-01-10 16:43 回答
你的3万多个变量?还是你有3万多行啊?
另外你是用R跑还是用PYTHON还是其它软件跑啊?
回复(0)
  1 1  
发表评论
相关问题
专栏作者
  • 傅一平
    统计网特邀认证作者
    浙江移动大数据中心 数据管理部经理 博士 毕业于浙江大学 10多年数据从业经验,专注于大数据采集、处理、建模、管理、变现及产业等研究
  • 数据海洋
    统计网特邀认证作者
    数据应用的实践者!
  • 黄成明
    统计网特邀认证作者
    黄成明 ,零售数据分析研究者,拥有15年的销售及数据分析经验,历经美国强生公司、妮维雅公司、雅芳公司和鼎盛时期的诺基亚公司。目前是数据化管理的咨询顾问和培训师。他独立研发了基于周销售权重指数的零售管理模型,可以有效地进行目标管理、销售预测、客流预估、促销评估、销售预警等。
  • tommy
    统计网特邀认证作者
    数据落地应用探索者
  • 张溪梦
    统计网特邀认证作者
    GrowingIO创始人&CEO,前LinkedIn商务分析总监
  • 秦路
    统计网特邀认证作者

打开微信,点击底部的“发现”,使用 “扫一扫” 即可将网页分享到我的朋友圈。

版权所有: 统计网. Copyright © 2016 itongji.cn All Rights Reserved. 备案号:ICP备15042641号-3