因AI成为当今主流的智能学习工具,所以要对以往的方法进行改善。同时,通过对数据的活用,可以获得以前无法得到的答案。而且,这条道路今后很可能会有更长远的发展。那么,智能学习具体是怎样的一种方法呢?
在讲智能学习之前,首先说明一下以前是怎样对计算机发出指令的。在考虑对计算机发出指令时,有3个必要因素:输入(input),程序算法,输出(output)。
其中最重要的就是程序算法。充分考虑这个程序(程序算法),是对计算机发出指令的基础。由人去努力思考程序算法,就是一直以来使用的方法。
而另一方面,智能学习的话,作为基础的程序(程序算法)不是由人来拟定,而是由计算机通过学习后自己去拟定的。可以大致理解为,计算机根据大量的输入数据和与之对应的输出数据,计算出输入和输出之间的相关性。
这样一来,人应该做的事,就不是思考程序算法,而是准备大量的输入数据和输出数据了。在这个过程中,计算机会根据数据来找出输入和输出之间的关联性,也就是可以发现程序算法。
我们用事例来进行补充说明。
例如,假设现在要拟定一个程序算法,输入是照片,输出是表情认知,即识别照片里的脸是在生气、是在笑还是哭。
在这种情况下,如果使用以前的方法,就要对头像照片的要素进行分解,指定哪个部位应该怎样观察,在怎样的条件下判断为“在生气”,在怎样的条件下判断为“在笑”,这些都是由人来思考并拟定程序算法。
相对地,如果采用机器学习的方法,最初的一步是准备输入和输出的数据。要准备多张头像照片作为输入数据,并且判断照片里面的表情是“在生气”,还是“在笑”,或是“在哭”,作为输出的数据来使用。
也就是说,把表情作为标签和照片对应,并且,把大量头像照片和对应的照片都录入计算机。最后,计算机就会参考大量的数据,思考可以识别表情的程序算法。
在机器学习的过程中,可以通过以下步骤来让计算机思考程序算法。
1. 决定什么作为输出
2. 决定什么作为输入
3. 准备多个输出和输入的组合
1. 决定什么作为输出
刚才的例子是以脸部表情作为输出,下面我们以销售额为输出来讲解。因为销售额作为目标非常明确,而且从量化的角度来说,可以用金额来表示,是非常清晰易懂的输出。
另外,如果以“学习”为例的话,情况会怎样?以学会了或者没学会作为输出,虽然可以作为方向,但是很难找到清晰的判断标准。
以往我们会以测试的分数作为是否学会的结果指标,但测试的意义不外乎是对记忆的确认,要充分考虑好定义以及具体要如何量化。
如上所述,在实际业务中,确定以什么作为输出是最重要的工作。
需要充分考虑“这个输出是要获得什么”“这个输出可以用什么来计量”,还要考虑“怎样可以量化”。
2. 决定什么作为输入
决定输出的内容以后,需要尽可能找出可能对这个输出内容产生影响的输入内容。数据越多,程序算法的精度越高。而且,对大量的数据进行处理是计算机擅长的事。因此,要有意识地找出尽可能多的可能对输出产生影响的内容。
另外,和输出一致,输入在最后也要进行量化。大家在罗列输入内容时,同时要有意识地思考如何能够进行量化。
3. 准备多个输出和输入的组合
输出和输入确定以后,最后一步就是准备多个这种数据的组合,把这些数据录入计算机。
现在需要的是,输入和输出的大量数据。如果输入的数据和输出的数据都已经齐全了,就没问题;另外,如果在某些地方已经存在这些信息,只要收集过来即可。
另一方面,如果需要重新收集数据,以后是否能够固定地获取数据也要一并考虑。
练习题
你在人才培养公司工作,主要负责邀请社会人士来听本公司的讲座。上司交代你,希望能够使用AI进行判断,向有意愿听讲座的人员推荐合适的讲座。你的手上有过往的实际数据,知道什么讲座比较受哪一类人群欢迎。
你考虑制作AI程序,以什么讲座受欢迎(推荐什么比较合适)作为输出,那么什么内容可以作为输入呢?请思考几个可能与推荐讲座有关系的因素。
解答
与所属企业有关的信息可能有行业、职位、部门、企业规模,与听讲座的人有关的信息可能有年龄层、性别等。
例如,如果收集到了以下关于输入和输出的数据,就要以输入数据和输出数据组合的形式来录入计算机。
这样的话,把行业、职位、部门、企业规模、讲座购买者的年龄作为输入数据录入后,计算机就会根据对过往实际数据进行学习的结果,作为输出,推荐哪些讲座科目比较合适。
STEP UP!
从学习的意义来说,实际上不止于此。计算机推荐的科目,在推荐之后,最终是否真的销售出去了;或者说,购买者是否选择了别的科目,这些结果可以作为数据进行积累。这样,讲座课程是如何销售出去的,相关数据就能进一步累积起来。
通过这样去做,累积起来的数据就能用于下一次学习,形成良性循环。
因此,哪怕最初的数据非常粗略,重要的是尝试迈出第一步。虽然数据量较少,结果输出的数据精确度也不高,但是一旦开始尝试了,数据就会进一步积累,产生更高的价值,形成良性循环。所以,大家要重视速度,尽快着手去做。
过往是由人来思考程序算法。只要准备数据,计算机就能推导出程序算法,这是以前从未有过的方法。
而且,这是一个信息量越大,精确度越高的划时代的方法。今后,是否能够充分运用这种方法,就决定了能取得怎样截然不同的结果。
大家要切实理解机器学习是怎样的一种方法,以及输出、输入的数据化的关键作用。
小结
√ 机器学习是由计算机来拟定程序算法,是从前没有过的方法
√ 程序算法是基于大量的输入及输出数据,由计算机所拟定
√ 人的职责是,准备输出和输入的定义以及数据
√ 输出的定义和量化的方法最为重要
√ 积存的数据会产生更高的价值,所以迈出第一步非常重要