信息来源:北京科学中心 发布时间: 2021-01-31
2021年1月30日,首都科学讲堂线上开讲,本次首都科学讲堂邀请了中国科学院数学与系统科学研究院研究员刘歆,为大家带来题为《人工智能:最优化和数据科学》的精彩讲座。
人工智能:最优化和数据科学
作为科学皇冠上最璀璨的一颗明珠,数学是一个非常抽象但是又极其重要的学科,人们经常问,到底什么是数学?数学到底跟日常生活有哪些关联?从计算机到人工智能,它们如此“聪明”的原因是什么?
第一讲 奇妙数学:无处不在的最优化
我们知道,数学是专门研究数量、结构、变化、空间以及信息等概念的一门学科,是所有科学密不可分的重要基础。历史上,数学的重要性被很多人推崇和肯定,哲学家柏拉图曾说数学“是一切知识中的最高形式”,哲学家培根也将数学形容成“通往科学之门的钥匙”。在数学家高斯眼里,数学是科学的皇后,因为在他看来数学是一门非常美的学科,二来是因为在西方的国际象棋中,皇后的作用是非常巨大的——既能当中国象棋中的车,横走竖走,也可以像象一样斜着走,是整个国际象棋中功能最强大的一颗棋子,由此可见,数学在高斯眼里是多么重要。
数学主要可以分成两大类:一部分是基础数学,它包含了平面几何、立体几何、解析几何;另外一种就是应用数学,它的分类非常广、涉及得也非常广,像概率统计、数学物理方程、系统与控制,而我们今天要谈的最优化也是其中之一。
作为一门古老而又青春的交叉学科,最优化将运筹学和计算数学交叉在了一起,那么到底什么是运筹学、什么是计算数学呢?
提到运筹学,我相信大家应该都知道一句话,那就是“运筹帷幄之中,决胜千里之外”。这句话本来是刘邦对张良的评价,但是从科学的角度来看,它研究的正是千里之外的人如果想要赢,他需要做些什么、准备些什么,而这正是现代运筹学所思考的范畴,即在生产、战争或是劳动中,我们应该如何决策,才能取得最佳的效果。
跟这个很像的还有“田忌赛马”:齐威王喜欢赛马,他有上等马、中等马、下等马三种等级的马匹,有个大臣叫田忌想跟王来赛马。那很明显,如果使用上等马对上等马、中等马对中等马、下等马对下等马,田忌无论如何都会输。但是田忌人很聪明,他用自己的下等马出战齐威王的上等马,用他的上等马对齐威王的中等马,用他的中等马对齐威王的下等马。这样,田忌虽然第一场输得非常惨,但后两场他都胜了,结果就是2:1赢了齐威王。
除了田忌赛马,著名的欧拉七桥问题也是一个很典型的最优化问题:18世纪东普鲁士有一个城市叫哥尼斯堡,这个城市被两条河分成了四个区域,且这四个区互相之间又不连通。为了沟通方便,人们架了七座桥把这几个区连接在一起,但后来人们就想,有没有什么方法能一次性地把这七座桥都走一遍,但同时又不走重复路呢?基于这个问题,彼时的著名大数学家欧拉提出了“一笔画”原理并以此得出了结论,即哥尼斯堡这个问题无解——人不可能不重复地走遍这七座桥又回到原点。
这些例子都告诉我们,决策在生活中是非常重要的,决策者希望选择对自己最有利的方案,而这个最有利的方案就是优化,就是我们这个学科的最优化。
放到现代社会,运筹学的应用范围就更广泛了。在我国,山东师范大学的管梅谷教授提出了一个非常有名的国际问题叫“中国邮递员问题”,这个问题是说,如果一个邮递员从邮局出发开始投递快件,他要怎么走才能一面走遍所有街道,一面还能确保他走的总路程最短?不得不说,寻找最优化方案几乎渗透到了我们日常生活的方方面面,比如说网购卖家应该怎样分配物流、分配仓储、调配库存?比如说如何考量是否应该在一个城市新建一座大桥,在哪里建才能缓解交通堵塞?……这些问题的背后其实都隐藏着很多有趣的数学模型。
第二讲 计算数学:从理论到实践生产
说过运筹学,我们再谈谈计算数学。举例来说,当我们想买桌子的时候,很少有人会跟卖家说“我要一张边长的桌子”,因为这个尺寸打造不出来,我们没有一把尺子可以度量。那什么样的尺寸是可以度量的?比如说1米——想打一张边长1米的桌子非常容易,1.4米也容易、1.41米也还可以,但1.412米就有点难度了。换而言之,从1米、1.4米到1.41米再到1.412米,因为这些数都是有限小数,所以对于工程师而言它们都是可以生产的,但对于这种无限小数、无理数,尺子量不了工程师也就做不了,这个将理论和应用连接在一起的桥梁就叫“计算数学”。
计算数学就是把数学家、物理学家们提出的一些无法从事实践生产的方程,求解成小数点或带若干位小数的有限小数,给工程师用来实际生产制造。而在这个过程中,跟计算数学关系最密切的就是方程,这个方程可以是数学的方程也可以是物理的,更可能是力学方程、电磁学方程、化学反应式。换而言之,将工程师和自然科学连接在一起的是计算数学,计算数学家通过写计算机能够识别的语言,让计算机计算出一个工程师需要的数学精度,而实现这些的算法又需要大量的数学理论支撑。
正如前文所说,运筹学和计算数学一同构成了最优化,也就是要研究在一定约束下,我们想要集小化一个或者是集大化一个函数,那么要如何设计计算机的算法,才能让计算机实现这一点呢?这,就是我们最优化所研究的范畴。
早年华罗庚在70年代推广优选法的时候曾提出过一个概念叫“瞎子爬山”,其实这就是我们所说的“最速下降法”。具体来说,“瞎子爬山”说的就是跟人爬山会看路不一样,计算机摸不清山峰在哪里,不知道如何才能绕着山路走上去,它就像是个盲人一样。那它怎么“爬”?盲人有拐杖,他站在原地,通过拐杖他就能摸清哪里地势最高、哪里地势最低,这样走一步摸一步爬到山顶。类似地,最优化里所说的“最速下降法”也是这样——拿下降和上山相比对,当大家极大化一个函数的时候,如果想要取这个函数的负数,其实就等于去极小化一个函数,这跟“瞎子爬山”是找顶峰、最速下降是找“谷底”一样,背后的逻辑和原理是一样的。
第三讲 最优化与大数据、人工智能
那么学好最优化有什么用呢?谈到它的应用,我们第一个想到的应该就是大数据和人工智能,首先我们来谈一谈大数据。
事实上,大数据这个词其实在20年前都没有听到过,也就是最近十多年才提出来的,究其原因还是因为人类获取、存储和处理数据的能力都获得了提升。就拿我们经常说的追踪大数据来说,它的本质其实就是人的行程,是我们手机记录下的每个位置的轨迹形成,这样的数据在日常生活中还充斥在各个方面,比如说银行的、公安系统的、医疗问诊的……可以说,这几十年间人类获取数据的能力都得到了巨大的提高。
其次,我们的数据存储能力也有了非常大的提升。在过去,我们用来存储数据的软盘只有几十KB,现如今硬盘动辄就500G,更不用说像一些大的IT企业,他们还有着更高级别、存储能力更高的数据存储设备。因为获取数据、存储数据和处理数据的能力都得到了提升,所以我们如今才能谈数据科学,而后者的本质实则跟数学建模非常类似,都是以生产实践需求为基础,然后研究如何通过数学手段来解决这些需求。
在大数据领域,人工智能就是最优化的一个典型,那么到底什么是人工智能?说得简单一些那就是,你将自己的所见所识所感甚至是决策输入给电脑,用这段代码来让计算机“熟知”人的决策过程、“感知”同样的事件,这样在以后,计算机就可以做出相同的决策。当然不可否认的是,这是人类所设想的一个人工智能的终极形态,但我请大家仔细想想,想要实现这一目标的前提是什么?是数据的积累,只有有海量的数据才能实现这种决策,而这就是所谓的机器学习——它需要你先告诉它这段代码,比如看到红灯要停、吃到难吃的东西要吐,让它学习遇到这种信息之后会采取哪些决策,当它的数据量积累到一段时间,它就可以告诉你“现在我知道如何对你给我输入的情况做出正确反应了”。
第四讲 浅谈人工智能中的最优化
那大数据、人工智能又和优化有什么关系呢?在此之前,我们可以先看一个非常有意思的表格,这个表是告诉我们10的每一个量级对应的中文分别是什么,除了一、十、百、千、万、亿、兆,在此基础上兆是10的12次方,京是10的16次方,垓是10的20次方……由此可见,从很早开始,中国人的思维就已经不局限于日常的范畴了。
事实上,最优化也体现在人工智能的应用场景之中,譬如图像处理。大家都知道,屏幕一般都是由一个个小颗粒组成的,这个小颗粒就叫像素、像素点,每个像素点存着一个灰度值,从全黑、0到全白、255,它中间有一个变化的过程,它分了256等,就是慢慢地渐变成从黑到白。
那彩色的屏幕又是怎么实现的呢?大家知道有红、绿、蓝三原色,每一种原色它都对应一种灰度值,所以说每个小像素又是三组灰度值,即红的、蓝的、绿的灰度值分别是什么,它组合在一起就是我们看到的多姿多彩的色彩了。基于此我们可以知道,一幅图片的本质是一堆海量数据,比如说1000×1000的图片有100万个像素点,它存储的数字实则是300万个,分别对应的每一个像素点是红色、蓝色、绿色。当我们把这个数目再扩大一倍——1万像素×1万像素,那就变成1亿个像素点,那这幅图像的规模会更大,但人在感知上就会变得更好,图片“看上去”就更清晰、更好。
再比如说,疫情期间也有很多事情跟最优化息息相关,比如说大规模的核酸检测。之前新闻里说,我们能在三天之内测1000多万个样本,这是怎么做到的?我们十个一组测,而不是一个一个测,十个一组有问题了我们再单独检测,那么检测的样本量就从1000万降到了100万份,而这个过程体现的就是一个最优决策的过程。
此外还有推荐系统,这也是我们特别熟悉的一个最优化场景。大家可能都知道,我们同样是用一款购物APP,它的推荐产品却不是一样的,比如女生看到的可能是衣服、化妆品,男生可能看到的是球鞋、玩具,而这些都是根据用户的习惯来推荐的;还有豆瓣的电影评分系统,它的背后也涉及到诸如“矩阵完整化”这样的数学模型,而想要求解这个数学模型更需要我们寻找最优化方案,可见,推荐系统和最优化是密不可分的。