专业网站建设品牌,十四年专业建站经验,服务6000+客户--广州京杭网络
免费热线:400-683-0016      微信咨询  |  联系我们

如何成为一名数据科学家_java

当前位置:网站建设 > 技术支持
资料来源:网络整理       时间:2023/3/5 16:08:00       共计:3595 浏览

如何成为一名数据科学家?

Intuit资深数据科学家&创新领袖George Roumeliotis认为,数据科学家是一个结合了应用数学、计算机科学、商业资讯和新产品开发的综合职位,最后一项目前在数据科学中的比例越来越大。一名出色的数据科学家应该像瑞士军刀一样多才多艺,能够在诸多领域都有所作为,并且在一两个区域内拥有深邃的真知灼见。

数据科学家需要有三个方面的技能或素质:

经典统计学或者机器学习、计算机科学和商业咨询能力。

其中,数据科学家的技术列表大概包括了统计学、机器学习、SQL和Hadoop,以及一门类似Java一类的主流编程语言。

先说数据库技术,熟练使用SQL语言和Hadoop绝对是绕不过去的条件,如果你还是一名在校大学生,你一定要学会它。可以参加一些相关的基础课程,并要确保课程里包含了一个至少有一部分需要你动手去完成的项目。

再说编程技术,学会R语言是重中之重。这个语言写起来不那么漂亮,但是绝对是一个非常通用的语言。另外,你需要学会一门主流的编程语言,比如Java或者C++。当然,学会一门主流的脚本语言,例如Python和Perl也是很有用的。

如果你需要给这些语言或者技术做一个优先级排序或者估计一下它们的比例,大概是这个样子的:

同样,商业咨询能力也是很重要的,它是区分数据科学家与数据“技术宅”的重要指标,一个具有商业咨询能力的数据科学家就像是一个资深的麦肯锡咨询师,可以流畅地在商业和技术两个区域腾挪闪转,并且是一名能被人信任的商业顾问或者领袖。

那么,怎样才能成为具备这些能力的数据科学家呢?

对于有志于数据科学的本科或者研究生同学,哈佛大学应用统计专业教授Joe Blitzstein给出了学习建议:

充分利用在线资料:在网上可以找到大量关于数据科学的资料,不要只埋头在书本里。动手做Kaggle之类的竞赛:

除了看书和学习在线课程以外,切记一定要去Kaggle网站上动手做一些类似Kaggle的竞赛。Kaggle上有非常有趣的数据集以及问题等待大家去处理,大部分都是关于预测变量的。你可以尝试一个或者几个比赛,找到那些你感兴趣的数据集,大胆地参与其中,也可以从中找到各种各样关于回归模型和机器学习的问题。去看那些不同的问题,然后尝试去用每一个问题提供的数据解决它们,你将会对于用什么方法解决什么问题有更深的理解。这些东西中有很多都是很难通过课程来学会的,需要上手写代码做东西才能知道。

努力去做数学、统计学和计算机这三种学科的交叉型人才,并且牢牢地打好基础。专注于解决现实问题,要记住深度比广度有用。解决一些有难度的问题,这样你可以将自己的课堂所学运用于现实生活中,获得更多的想法,以及能准确地判断这些想法与数据科学有没有关联。要多问问题,以及严谨求实:

随时随地问自己一个很基本的问题:“有谁会关心这个问题?”多想想你做这一切的动机。为什么这些变量相互关联?为什么这个数据集有意思?我们能用它回答什么问题?当你使用不同的统计方法的时候,不要只是像用架子上的一个黑盒子一样,拿过来用它产出结果。一定要多问问题!这些结果有意义吗?你如何评估你使用的方法是不是靠谱的?或者说你怎么知道用这个复杂模型的效果要比随便去猜更准确?你怎么知道它更好?它在哪些方面更好?它确实比一些很简单的模型好吗?不停地去试问这些东西,然后去比较它们。无论结果有没有变好,都一定要深究下去。

如果你想获得更多关于如何成为数据科学家的方法,可以去阅读这本《数据科学家访谈录》。这本书对25位世界知名的数据科学家进行了深度的访谈,从不同的视角和维度,将他们的智慧、经验、指导和建议凝聚成册。每一篇访谈都是一次深度的交流,涵盖了这些数据科学家从菜鸟起步,运用各种知识武装和充实自己,一直到成为一名卓有成效的数据科学家的全过程。通过阅读本书中的访谈,读者可以形成对数据科学的宏观认识和了解,更深刻地认识和体验数据科学家的角色,并且从这些前辈的过往经历中学到宝贵的知识和经验,以应用于自身的成长和事业中。

更多精彩内容,请关注@人民邮电出版社 头条官方号

版权说明:
本网站凡注明“广州京杭 原创”的皆为本站原创文章,如需转载请注明出处!
本网转载皆注明出处,遵循行业规范,如发现作品内容版权或其它问题的,请与我们联系处理!
欢迎扫描右侧微信二维码与我们联系。
·上一条:西门子PLC数组编程方式array_PHP基础 | ·下一条:java怎么在程序中处理数组越界异常_java

Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有    粤ICP备16019765号 

广州京杭网络科技有限公司 版权所有