首页

登录 | 注册

大数据算法

如何高效地学习编程语言

数聚联   2017-05-12

学习编程语言是一种技巧:做好了,你会感受到掌握新事物之后的快感(dopamine:多巴胺);做不好,就会接二连三的沮丧,甚至放弃。

阅读全文

统治世界的十大算法

数据联   2015-12-09

算法对于我们今天生活十分重要,怎样宣扬也不会夸张。它们在虚拟世界中无处不在,从金融机构到交友网站。但是,相比于其他算法,其中有一些算法更大程度上改变并控制着我们的世界——本文列举了其中十种最为重要的算法。

阅读全文

数据相关性挖掘大讲堂:(二)非线性相关评价方法

数据联   2015-10-30

算法是数学对象,数学比法律要精确的多。如果我们没有能力去在数学上精确的界定公平性,也就不能抱希望去设计一个公平的算法。一个好的公平性数学判定方法可以为任何子群体在任何情况下规范决策的无偏性,而不会出现雇佣偏见和性别偏见。

阅读全文

一个难以解决的问题:大数据算法产生的偏见与歧视

数据联   2015-10-30

算法是数学对象,数学比法律要精确的多。如果我们没有能力去在数学上精确的界定公平性,也就不能抱希望去设计一个公平的算法。一个好的公平性数学判定方法可以为任何子群体在任何情况下规范决策的无偏性,而不会出现雇佣偏见和性别偏见。

阅读全文

关联分析:开启大数据之门的钥匙

数据联   2015-09-07

关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。

阅读全文

数据相关性挖掘大讲堂:(一) 线性相关评价方法

数据联   2015-09-16

“相关理论”是统计学中重要的理论之一, 它揭示了两个或两个以上的事物或现象之间的相互关系。“相关理论”的产生对统计学的发展有着极其重要的意义和影响,为统计学应用于其他社会学科提供了有利的工具。

阅读全文

Databircks连城:Spark SQL结构化数据分析

数据联   2015-09-07

数据科学家们早已熟悉的R和Pandas等传统数据分析框架 虽然提供了直观易用的API,却局限于单机,无法覆盖分布式大数据场景。在Spark 1.3.0以Spark SQL原有的SchemaRDD为蓝本,引入了Spark DataFrame API,不仅为Scala、Python、Java三种语言环境提供了形如R和Pandas的API,而且自然而然地继承了Spark SQL的分布式处理能力。

阅读全文