图形中罗列的机器学习、可视化、信息系统、计算机模式识别等词汇,都是计算机中常见的字眼,通过它们我们就可以大体了解到具体的学习方向和内容,从而有针对性地去下功夫学习。以此类推,其他学习方向的课程也可以通过这种形式来表现。以数据科学硕士为例,我们可以按照刚才的图形把关键词提炼出来,再通过观察这些关键词跟其他词之间的关联性的强弱,按从小到大的顺序组合并排序,这个过程需要具有专业经验的主观判断的帮助,排列之后我们就得到了课程的具体内容。需要注意的是,有的课程比较冷门,可能无法从图形中提炼出来,另外,国外好多课程的名称取得比较随意,不同课程名称对应的也许是相同的内容。
数据科学硕士有好多门必修课,就是必须具备的能力,包括机器学习、WEB数据挖掘、数据管理、统计分析、分析程序设计、系统设计等。除了必修课以外还有选修课,就是你还需要具备的其他技能。而机器学习这门课程,在必修和选修中都有提到,这是因为课程设置会因为学校的不同而有所差异,但总的来说,几乎所有的课程都跟计算机、统计、数据有关,那这些肯定就是我们“修炼”的重点。
数学是学习大数据技术的选修课。学习大数据最好有一定的数学基础,如果没有基础,学习起来会比较困难,但也不是一个无法逾越的障碍。大数据时代,人们都是用工具去梳理数据的,现在的数据量巨大,不借助工具根本不可能梳理得过来。那么,都要用到哪些工具呢?最常见的是EXCEL;其次,还有一个叫SAS的商业软件,是世界五百强企业的产品,美国《财富》杂志评选推荐的;再有,必须要了解的两款开源软件:R语言和Python。R目前是一款免费软件,搞统计的人如果不会R语言那是不可想象的。有一句话说得好,R的出现使搞统计的人终于可以使用计算机了,Python的出现使用计算机的人终于可以搞统计了。以上列举的几个工具必须要非常熟悉,因为很多学校都不会开工具课,它默认你已经掌握了。除此以外还有Hadoop,它是大数据处理的架构,现在不是很主流了,但对理解课程来说还是必须的。
已有0人发表了评论