【文字实录】大连接时代：创新智能变革（5）_重要发布_第四届世界互联网大会_时政_系列微专题_专题

摘要：第四届世界互联网大会分论坛——大连接时代：创新智能变革于12月4日9:00-12:00在乌镇互联网国际会展中心垄行厅举行。

田溯宁:

谢谢余总给我们带来非常精彩的演讲，下面我们请谢雅正教授给我们分享一下他的一些观念，有请谢教授。

2017-12-04 10:11:37

斯坦福大学教授谢雅正:

我今天非常荣幸来到乌镇，我今天要给大家谈谈机器学习。我知道今天论坛的主题就是“大连接”。

2017-12-04 10:11:52

谢雅正:

首先从基础的连接开始，我觉得最基础的连接就是我们的基础设施，基础设施的连接就是让大家先连接个人。那么现在看来，现在的基础设施可能有一些落后了，而且这个基础设施变得太庞大了，对于个人来说都过大。所以这就带来了另外的一个所谓的机器学习。

机器学习是由很多数据连接支撑的，所有的基础设施建设能够允许我们获得这些数据。我们仔细来看一看这个事情，这个机器学习事实上是在基于基础设施的进程上不断的推进的，要讨论这个问题的话，首先我会给大家来谈一谈机器学习的进展，然后是怎么回到基础设施上面来应用。

2017-12-04 10:14:47

谢雅正:

首先，最基本的一个问题，就是机器要学会去识别。首先有一系列的数据，看到它是不是有一些问题啊？那我们看到这是一个视觉比赛的结果，是有1400万的图像在上边，分成了21000种的类别，非常的纷繁复杂。机器首先要培训出来怎样来识别这些数据，然后怎样来测试这些数据。所有机器学习的目标都是要学习这些模式，都是要从培训到测试数据这样的一个过程，唯一的想法就是要学习归纳，首先要观察，然后才能学习，然后要更加深入地去观察，然后得出总结。

2017-12-04 10:17:30

谢雅正:

我们来看，这样的一个算法它在过去几年当中到底是怎样做到的。首先可以看到从零到无的过程。从分类的角度来看，这是分类出来机器学习最开始犯的五类错误，慢慢开始在大规模视觉挑战赛之后啊，我们发现有一些进展，你们看到这个紫色的这部分，其实是深度学习不断地在增强进行更加复杂问题的学习，其实这方面的话通过深度学习，其实是已经取得了不小的进展，这就是一个深度学习，它是多层的非常复杂的一个过程，我觉得现在已经超过了甚至上百万个层级的级别，现在就是机器学习的基本模型。

2017-12-04 10:20:57

谢雅正:

那么对这些数据进行分类以后，人类就能够识别到这些数据。在获得了这些数据之后，人是会做出一些反馈的，机器要做的事情就是要不断地去控制。在最近几年当中机器其实已经在学习如何控制方面取得了一些巨大的进展。

2017-12-04 10:21:25

谢雅正:

Atrai和AlphaGO其实是两个典型的例子，他们已经能够学会不断的控制，不仅仅是观察这些数据，而且他们已经能够学会如何去玩Atrai跟AlphaGO。

2017-12-04 10:22:42

谢雅正:

这就是另外一个显示如何来玩Atrai的例子。这是我们的人脑，你首先要观察整个环境，观察这些数据，你可以看到这些数据都显示在屏幕上，然后会采取一些措施，你看人通常是会拿指挥棒摇动游戏棒去玩，如果你每次测试成功你会得到一些奖励，这就是一个控制的过程。

2017-12-04 10:23:02

谢雅正:

现在有一个问题，一开始的时候你就不知道会发生什么问题，其实是非常随机的一个过程，但是随着你玩的越来越多，你就会获得越来越多的经验，那你会知道后来我做这些行动，之前应该采取怎样的措施，所以就不断地通过你看到的一些题目来进行训练，其实这些前面我们谈到这些数据就是它训练的数据。

2017-12-04 10:23:44

谢雅正:

其实你这个不断对数据的训练也是一种控制的过程，当然这是一个非常复杂的过程，但是有一个是共同的，跟我们人是一样的一个认知的过程，就是要归纳，机器也是要归纳，不管以前你经历了怎样，有多少丰富的经历，不管你看到的图像、看到的数据，即使是你没有看到的一些图片你还是会做出一些反应，这个过程跟机器学习是一样的，机器学习就是在这个基础上深入地后来发展了深度学习，来学习到人的操作。

2017-12-04 10:24:21

谢雅正:

所以啊玩游戏当然是非常有趣的一个事情，我们自己玩游戏的过程当中这些机器学习的浅识，人类会采取一些行动，机器也要采取行动，最终的目标呢就是说要完成这个，要获得这样一个奖励。

大家都知道大家所有学到的东西都是从过去的经验当中学到的，那机器也是一样，慢慢地来学习这个控制系统，控制的过程。这跟我之前谈到跟基础设施建设的连接有什么关系呢？我们现在有很多控制性的问题，特别是在网络当中，这就是我们相互连接的一个基础设施，那最上面大家可以看到有这些应用，有不同的一些应用，当然这是需要基于这种沟通、通信的基础设施建设是已经有了现存的存在那里，你可以看到上面有不同种类的，到了中间有一个控制台，我们的目标就是要将这个控制台能够处理这些信息，在分享的平台上能够分享这些数据，而且这些数据都是不断地呈现动态变化。

现在的目标就是深度交互的学习，能够处理一些非常具体或者非常难的一些问题，从现在的这种实时数据当中获得一些数据。

现在这个研究计划要在社区当中实现的，那么给大家一个例子，在MIT我们所做出的一些成果，我们来看一下这个控制系统是怎么解读流媒体的过程。

2017-12-04 10:25:43

谢雅正:

你可以看到这里有一个视频，突然截取一段视频，而且能够就知道这个视频当中到底在放什么。那怎么看这种连接性呢？整个的服务器应该说是视频的服务器是不断处于动态的状态，视频的服务器是怎样能够反馈数据到视频客户那呢？

在服务器跟客户之间，中间有这样一个测出来的能力，当然这也是取决于你到底要达到怎样的要求，有时候你可能就失败了，大家可以看到这个视频就不动了，这就是一个控制问题。首先要跟媒体之间相互连接，然后将这两个之间的频道相互连接起来，不管它工作好还是不好，那么我们做的事情就是让这个机器学会交互的学习，而且不需要通过建模就能够交互的进行连接，这就是一个结果，你可以看到这是深度学习的机器，这种深度学习的结果就是能够来很好的放视频了，在这样的建模情况下就不需要进行缓冲。

不管我们基础设施是怎样的，是我们不断地在推进机器学习，未来肯定是大量的数据存在，我们目前其实是获得了一些机器学习所取得的成果，同时要促进机器学习的时候，如何来提升基础设施建设，谢谢。

2017-12-04 10:26:33