您的位置: 主页 > U半生活 >打败 R 语言,Python 是如何登基成为史上最热门数据分 >

打败 R 语言,Python 是如何登基成为史上最热门数据分

发布时间:2020-07-11

打败 R 语言,Python 是如何登基成为史上最热门数据分

根据 KDnuggets 2017 年最新调查,Python 生态系统已经超过了 R,成为了数据分析、数据科学与机器学习的第一大语言。本文对 KDnuggets 的此项调查结果做了介绍,并补充了一篇文章讲解为何 Python 能成为数据科学领域最受欢迎的语言。

Python vs R:2017 年调查结果

近日,KDnuggets 发起了一项调查,问题是:

你在 2016 年到现在是否使用过 R 语言、Python(以及它们的封装包),或是其他用于数据分析、数据科学与机器学习的工具?

预料之内的是,Python 并没有完全「吞噬」R 语言的空间,但这项 基于 954 个参与者的投票显示 ,Python 生态系统在今年已经超越了 R 语言,成为了数据分析、数据科学和机器学习的第一大语言。

打败 R 语言,Python 是如何登基成为史上最热门数据分

值得一提的是,在 2016 年的调查中,Python 还处于落后地位(34% 比 42%),在 2017 年,两者的对比是 41% 比 36%。

此外,参与这项调查的 KDnuggets 读者也 有倾向于共同使用 Python 和 R 两种语言的趋势(12%),而使用其他工具的人则有所减少(从 16% 降至 11%)。

打败 R 语言,Python 是如何登基成为史上最热门数据分

 

下面,让我们看看不同平台之间的转换。

打败 R 语言,Python 是如何登基成为史上最热门数据分

这张图看起来有点複杂,其中有两个主要方面都是 Python 获得胜利。

忠诚度 :Python 的用户显得更加忠诚,有 91% 的 2016 年 Python 用户仍然在使用这个语言,而 R 语言的忠诚度为 74%,其他平台为 60%。

转换趋势 :只有 5% 的 Python 用户转投 R 语言,反向转换的比例则是 10%。而对于在 2016 年使用两种语言的用户而言,只有 49% 的人仍在使用双平台,38% 现在只用 Python,而 11% 转移到了 R 语言上。

在 KDnuggets 2015 年的调查中,并没有提出「同时使用 Python 和 R 语言」的选项,所以下图的趋势线中,2016 年和 2017 年的数据按照如下公式进行了转换

Python=(Python 比例)+50%(同时使用 Python 和 R)R=(R 比例)+50%(同时使用 Python 和 R)

我们可以看到,R 语言的使用份额正在逐渐下降(从 2015 年的 50% 降低到了 2017 年的 36%),而Python 的比例则呈逐年上升趋势——从 2014 年的 23% 增加到了 2017 年的 47%。 同时,其他平台的使用量在逐渐减少。

打败 R 语言,Python 是如何登基成为史上最热门数据分

最后,让我们看看这次调查的参与者地区分布:

美国/加拿大:40%
欧洲:35%
亚洲:12.5%
拉丁美洲:6.2%
非洲/中东:3.6%
澳大利亚/纽西兰:3.1%

为了简化图表,在下图中,同时使用两种语言与使用其他语言的比例被合併。

打败 R 语言,Python 是如何登基成为史上最热门数据分

我们在所有地区都发现了同样的模式:

Python 的比重增加了 8%-10%;
R 语言的比重下降了 2%-4%;
其他平台的比重下降了 5%-7%。

Python 用户的未来看起来一片光明,但我们预期 R 和其他平台在未来会保持住一定比重,因为它们巨大的嵌入式基础。

Python 是如何上升到数据科学顶峰?

可以肯定地说,Python 是一个十分受欢迎的工具,它涵盖了各个行业的各种职业。由于它亲近性的语言、丰富的资源和框架以及它庞大的硬体开发族群,Python 自然是开发人员们的首选工具。

Packt 在 2017 年的技能调查显示,在不同职位的技术专业人员中,Python 从 2016 年的第二名上升成为用户最多的工具。

我们向 Sebastian Raschka 提问:为什幺不论是应用机器学习还是深度学习的研究者,亦或是 Packt 的畅销书 Python 机器学习的作者都转向了 Python 学习?这个语言的下一步将会是什幺?他不得不承认:Python 已成为近二十年来最流行的语言 。

Python 是如何成为数据科学通用语言?

Python 是有史以来最流行的程式语言之一,这一点是毫无疑问的。但是一开始是如何发生的确实很难描述,是语言本身还是对编程语言的爱?是否是我们首先为科学计算、数据科学以及机器学习开发出优秀的开源的数据库才推动了大家选择 Python 作为他们的工具,或是因为越来越多的人在使用 Python 我们才把这些开发出来?

无论哪一种是对的,有一件事是足够显而易见的: Python 是一种非常通用的语言,易于学习和使用。 在我看来,这是今天它被如此普遍使用的原因。虽然科学计算的大多数算法都没有在纯 Python 中实现,Python 仍然是用于与 Fortran,C / C ++和其他语言中的非常有效的 实现交互的优秀语言。

所谓的从计算高效的低级语言调用代码,以及Python 为用户提供一个非常自然和直观的程式编写接口的这一事实可能是 Python 作为通用语言普及的重要原因之一,特别是在数据科学和机器学习社区中体现的更为明显。

未来的框架:我们应该关注什幺工具、框架和数据库

Python 开发了许多有趣的库。作为一名数据科学家或机器学习从业者,我时常从 Python 核心科学堆栈中重点关注维护良好的工具。例如,NumPy 和 SciPy 是就是用于处理数据数组和科学计算的高效库。

当涉及严重的数据清洗时,我们可以使用多功能的 Pandas 包。Pandas 是一个开源库,可以为 Python 编程语言提供快速简化的数据处理和数据分析工具,它主要是为 Python 提供现实和高端的数据分析。我还建议使用 Matplotlib 进行数据可视化,Seaborn 还可以提供更多的绘图功能和更专门的绘图。此外 Scikit 学习是一个很好的通用机器学习工具,它为数据挖掘和分析提供了有效的工具。这可能是我最喜欢的一款了,因为它几乎可以为所有的基本机器学习算法和许多有用的数据处理工具提供一个非常好用的 API。

当然,我在自己的项目中发现了很多有用的库。当我需要额外的性能时,我首选的数据框架库是 Dask。Dask 是一个非常适合处理大型、难以装入内存的数据框架的库,它还能在多个处理器中进行并行计算。或者使用 TensorFlow、Keras 和 PyTorch,所有这些都非常适合实现深度学习模型。使用什幺库取决于你的个人偏好和项目需求,但是一直以来都有很多方便有趣、使用 Python 开发的框架,关键是找到适合你自己的。

Python 的未来是什幺样的?

在大多数人的眼里,Python 的未来非常光明。这个语言刚刚被 IEEE Spectrum 列为第一大程式语言。而 Packt 出版社最近的调查也显示它是最近一段时期内科技界最为流行的工具。仅管在这里,我们主要从数据科学和机器学习的角度谈论 Python,但我们也会经常听说其他领域的人们也认为 Python 是一种功能丰富的语言,拥有大量的库和完整的生态系统。Python 或许不是所有问题的最佳工具,但对于想要「完成任务」的程序员来说,它被认为是一种「有效」的语言。

此外,虽然 拥有大量库是 Python 的优势之一, 但它的大多数开发包目前都得到了很好的维护—— 那些数据科学和机器学习库每天都有新特性与提升。 例如 2006 年发起的 NumPy 项目,作为 Python 数据科学的核心库,最近它刚刚接受了价值 64.5 万美元的资助。

Python 及其相关库在我们的工作中扮演了重要角色,我非常感谢所有这些工具背后的开发者,没有这些开源库,Python 就没有今天。对于我们来说,Python 可以成为非常重要的工具,我希望它的用户们能够多考虑帮助开源社区的发展,不论文档修改、bug 修复还是新代码、新特性或新库,所有贡献都将帮助整个社区向前发展。因为这个富有活力的社区,Python 的未来有着光明的前景。

延伸阅读

附资源与完整指导!带你从零开始掌握 Python 机器学习
想学 coding 就从 Python 开始!超 Java 赶 C++,Python 登上最受欢迎程式语言 2017 年最完整自学资源懒人包:Python、Google Analytics 到人工智慧想学什幺全都包
高收入国家喜欢 R、Python;低收入国家喜欢 PHP 与 Android 开发
哪个程式语言最先死:Python 只剩 25 年可活,C 语言却可以活到 2062?

猜你喜欢

推荐阅读

《经济学人》提醒苹果 别过分依赖中国市场《经济学人》提醒苹果
《经济学人》提醒苹果 别过分依赖中国市场《经济学人》提醒苹果
美国苹果公司上季靠 iPhone 和中国市场,劲赚 180 亿美元,全世界哗然。不过,英国杂誌《经济学人》发表文章《iThrone》分析苹果公司业绩存在危机。苹果公司上季度的 764 亿美元收入,其中超过三分之二来自售卖 iPhone,共卖出 7,450 万部,平均每小时卖 3.4 万部,超出市场预期。虽然苹果公司属科技股,但商业模式却是最传统的销售热卖产品,从中赚取丰厚毛利。苹果公司要承担商品运

《经济学人》提醒苹果 别过分依赖中国市场《经济学人》提醒苹果

影视奇趣

2020-06-10 23:31
《经济学人权威预测:2050趋势巨流》:揭开未来的世界风貌
《经济学人权威预测:2050趋势巨流》:揭开未来的世界风貌
Vista来自风城,现居台北市,悠游于网路、媒体与科技产业。平常喜欢看看书,写写字。出版过电脑书、小说,更爱在字里行间寻觅人生的况味。试读连结2050年来临的时候,我还活在这个世界吗?这是我打开《经济学人权威预测:2050趋势巨流》这本书的扉页(当然,是用Chrome浏览器打开),第一个闪过脑海的念头。相较于许多前瞻未来的书,习惯用伤感的笔调来勾勒悲观的远景,这本由《经济学人》(The Econo

《经济学人权威预测:2050趋势巨流》:揭开未来的世界风貌

探险引领

2020-06-10 23:31
《经贸评论》泰国经济真的好转了?
《经贸评论》泰国经济真的好转了?
政府表示泰国经济已经好转,但民间不少业者仍抱怨现今经济不景气,生意难做。到底泰国经济是否好转?为什幺大部分人觉得经济低迷,生意越来越不好做,政府数据又显示经济正在复甦?从以下几点来探究原因:1、经济成长率政府表示经济正在好转,GDP增长率约为3%。目前经济确实呈现小幅度上扬,但与邻国相比,泰国经济成长低于寮国、柬埔寨、越南和马来西亚,过去业者觉得生意很好的时期,经济成长率则约为6-7%。2、出口2

《经贸评论》泰国经济真的好转了?

探险引领

2020-06-10 23:31
《结合抗老南非重生草与保湿精纯白桦甘露》专为溼热气候研发-
《结合抗老南非重生草与保湿精纯白桦甘露》专为溼热气候研发-
“ 人们终其一生都在追求完美,而我相信,自然就是最接近完美的状态 ” 2013年,ARMANI研究室在义大利南方潘特列拉岛黑曜岩后,更在世界另一端南非极地沙漠,发现一种仅能生长于严酷地区的高活性植物-南非重生草Myrothamus Flabellifolia,在乾枯10年状态下,仅需1滴水,就能在24 小时完全复甦,研发出两种非凡的顶级抗老新生力量。 2014年,针对亚洲夏日炎热气

《结合抗老南非重生草与保湿精纯白桦甘露》专为溼热气候研发-

技术评论

2020-06-10 23:31
《结局最让人傻眼的动画作品》就是要让粉丝玻璃心碎满地!
《结局最让人傻眼的动画作品》就是要让粉丝玻璃心碎满地!
在看动画的时候有没有让你一集接着一集看,但是结局却雷爆你的心的作品呢?除非先看过漫画打过预防针,不然看动画的时候肯定会让粉丝的玻璃心碎成一地。゚ヽ(゚´Д`)ノ゚。(欸)日本投票网站Charapedia就以「结局最让人傻眼的动画作品」为主题让网友选出结局吓坏自己动画作品,到底哪些作品上榜了呢?TOP10.《Angel Beats!》TOP9.《影子篮球员》TOP8.《东京喰种√A》▼《东京喰种√A

《结局最让人傻眼的动画作品》就是要让粉丝玻璃心碎满地!

探险引领

2020-06-10 23:32
《绘师版学校制服图鉴》二次元制服妹子一样可爱满点
《绘师版学校制服图鉴》二次元制服妹子一样可爱满点
我们之前跟大家分享过一篇《》,里面记录了许许多多日本高校女学生的制服资料,其实日本网路这方面的资讯还挺多的,有人做统计有人画图,甚至还有人出成APP让人下载想看就看,只能说种类之丰富不管你偏好哪一味都有门路,今天这篇「绘师版学校制服图鉴」,就是以二次元创作为主题的一篇制服锦集,相信对制服情有独锺朋友应该很会很爱^^这篇绘师版学校制服图鉴,里面的创作是出自推友「学校制服図鉴‏ @stay_blue1

《绘师版学校制服图鉴》二次元制服妹子一样可爱满点

科技要性

2020-06-10 23:32
相关推荐