中国统计网

登录

首页

分类浏览

专题

专栏作者

问答

线下活动

企业招聘

app下载

投稿

注册




【招募帖】中国统计网认证讲师招募
当有一天,你站在某地,看见某一个或一批人或者产品或者企业,他的成功都跟你有关!……
Python+大数据计算平台,PyODPS架构手把手教你搭建
大数据基本都是建立在Hadoop系统的生态上的,其实一个Java的环境。很多人喜欢用Python和R来进行数据分析,但是这往往对应一些小数据的问题,或者本地数据处理的问题。如何将二者进行结合使其具有更大的价值?……
Apache Spark的Lambda架构示例应用
目前,市场上很多玩家都已经成功构建了MapReduce工作流程,每天可以处理TB级的历史数据,但是在MapReduce上跑数据分析真的太慢了。所以我们给大家介绍利用批处理和流处理方法的Lambda架构,本文中将利用Apache Spark(Core,SQL,Streaming),Apache Parquet,Twitter Stream等实时流数据快速访问历史数据。……
大数据分析:从数字中“掘金”
在容易获取海量数据的时代,大数据分析是帮助企业决策的重要工具,但管理者的商业洞察力和智慧仍是不可缺少的重要因素。……
丑小鸭变白天鹅 数据中心进化三部曲
数据中心要由丑小鸭变成美丽的白天鹅,可不是那么容易的事儿,要经过很多漫长的技术变革过程,就让我们来看看数据中心是如何进化的吧。数据中心进化大致要经过三个大的阶段,本文将对每个方面做以详细介绍。……
神策分析的技术选型与架构实现
很多朋友很想知道神策分析(Sensors Analytics)是如何实现在每天十亿级别数据的情况下可以做到秒级导入和秒级查询,是如何做到不需要预先指定指标和维度就能实现多维查询的。今天正好在这篇文章里面,和大家交流一下我们的技术选型与具体的架构实现,希望能够对大家有所启发。……
航运大数据的罗生门
写这样的一篇文章,并不是要为航运大数据泼一盆冷水,而是希望与所有正在关注、从事航运大数据的朋友们共勉,路漫漫其修远兮,不论今天大数据的概念如何风光,明天大数据的概念是否会被淡忘,只要我们坚信数据中蕴含着能让航运业变革的重要信息,我们就要踏踏实实的把大数据做成实事,真正做好,不忘初心、上下求索!……
HBase最佳实践-读性能优化策略
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题。HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少。总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大。……
用R进行文本内容情感分析
情感分析基本上有两种方法,一种是极性分析,一种是情感类别分析。前者分析文章的总体态度是肯定还是否定,后者分析文章反映了喜怒哀乐愁中的哪种情感。……
利用可视化进行高级数据分析的五个步骤
在大多数科学研究中,大量的实验数据的统计分析工作通常由计算和统计方面的技术专家完成。 遗憾的是,这些专家不是相应领域研究的专家,这可能导致分析中的缺陷。 如果,研究人员本人能够轻松使用工具和方法来处理和分析数据,那么肯定会获得丰富研究成果。……
头像

赵良

版权所有: 统计网. Copyright © 2016 itongji.cn All Rights Reserved. 备案号:ICP备15042641号-3