阮敬:高端大数据人才需具备哪些专业技能(2)

摘要:本章节阮敬教授以数据科学硕士、应用统计硕士、健康医疗硕士等专业方向为例,具体讲解了高端大数据人才需要精通的各项专业技能,并详细介绍了这些专业在国外大数据市场的就业前景。另外,国外的大数据相关专业证书比较具有权威性,主要有数据科学、应用统计、商业分析、商务智能、健康医疗五项。

图形中罗列的机器学习、可视化、信息系统、计算机模式识别等词汇,都是计算机中常见的字眼,通过它们我们就可以大体了解到具体的学习方向和内容,从而有针对性地去下功夫学习。以此类推,其他学习方向的课程也可以通过这种形式来表现。以数据科学硕士为例,我们可以按照刚才的图形把关键词提炼出来,再通过观察这些关键词跟其他词之间的关联性的强弱,按从小到大的顺序组合并排序,这个过程需要具有专业经验的主观判断的帮助,排列之后我们就得到了课程的具体内容。需要注意的是,有的课程比较冷门,可能无法从图形中提炼出来,另外,国外好多课程的名称取得比较随意,不同课程名称对应的也许是相同的内容。

数据科学硕士有好多门必修课,就是必须具备的能力,包括机器学习、WEB数据挖掘、数据管理、统计分析、分析程序设计、系统设计等。除了必修课以外还有选修课,就是你还需要具备的其他技能。而机器学习这门课程,在必修和选修中都有提到,这是因为课程设置会因为学校的不同而有所差异,但总的来说,几乎所有的课程都跟计算机、统计、数据有关,那这些肯定就是我们“修炼”的重点。

数学是学习大数据技术的选修课。学习大数据最好有一定的数学基础,如果没有基础,学习起来会比较困难,但也不是一个无法逾越的障碍。大数据时代,人们都是用工具去梳理数据的,现在的数据量巨大,不借助工具根本不可能梳理得过来。那么,都要用到哪些工具呢?最常见的是EXCEL;其次,还有一个叫SAS的商业软件,是世界五百强企业的产品,美国《财富》杂志评选推荐的;再有,必须要了解的两款开源软件:R语言和Python。R目前是一款免费软件,搞统计的人如果不会R语言那是不可想象的。有一句话说得好,R的出现使搞统计的人终于可以使用计算机了,Python的出现使用计算机的人终于可以搞统计了。以上列举的几个工具必须要非常熟悉,因为很多学校都不会开工具课,它默认你已经掌握了。除此以外还有Hadoop,它是大数据处理的架构,现在不是很主流了,但对理解课程来说还是必须的。

责任编辑:杨雪校对:叶其英最后修改:
0

精选专题

领航新时代

精选文章

精选视频

精选图片

微信公众平台:搜索“宣讲家”或扫描下面的二维码:
宣讲家微信公众平台
您也可以通过点击图标来访问官方微博或下载手机客户端:
微博
微博
客户端
客户端