贺笛 (点击关注摄影师)

人工智能青年学者,胶片摄影师

如果说对科学的了解,让我知道这个世界上,有些东西有正确与否的话,对艺术的了解,让我们知道,对那些没有对错之分对事物和观点,应该采用主动尊重并试图理解包容的态度。

576168189.jpg

如今,人工智能不再是一个虚无缥缈的概念,它逐渐提高我们对技术的想象,挑战人类的智慧,甚至改变我们的生活。那么人工智能会不会挑战摄影,甚至挑战艺术创作呢?艺术家有一天会不会被人工智能代替?作为人工智能青年学者、同时是图虫资深摄影师的贺笛,本次将为我们带来他对人工智能和艺术创作之间的思考。他从事机器学习领域相关研究,主要研究方向为深度学习算法与其在自然语言处理任务中的应用,具体包括文本相似度分析,生成模型,机器翻译与文本分类等。他在机器学习顶级会议NIPS,ICML上发表过多篇论文,论文引用量上百,并长期担任许多人工智能顶级国际会议的审稿人。在研究前沿领域技术的同时,他在摄影创作上却依然坚持着“传统”的媒介——中画幅胶片。科学与艺术的关系,一直是他在不断思考的话题。

这是第 012 期「 图虫·Open See Talks 」

(原“胶囊Talks”)

Open See Talks是图虫创办的国内首个摄影师演讲项目


△ 演讲视频,点击即可播放

(下文为完整文字稿)

演讲全文

这是一个程序员与摄影的故事

大家好,我叫贺笛,实际上我觉得我这次讲的,可能和前面几位嘉宾讲的风格非常不一样,究其原因主要是因为,我其实根本就不是一位摄影师,而且我做的事情,也跟摄影没有太大的关系。如果非常诚实地讲,我就是一个写程序的人。作为一个程序员,其实和一个摄影师的生活是非常不一样的。比如说一个摄影师,可能每天需要到各个地方去跑,然后去拍云、拍雾、拍风景。而作为一个程序员呢,你需要的可能只是一个电脑、一个键盘,可能连鼠标都不需要,就能完成日常所需要做的事情。


来谈一谈人工智能

现在程序员里面也有很多分工,我是做什么的呢?我是一个去为人工智能编写程序的程序员。我觉得大家可能都知道,现在人工智能是一个非常非常火热的话题,这个更多的是来源于一些在游戏中取得的非凡的成就,比如说我们可以看到在两三年前,谷歌的AlphaGo在一个非常具有挑战的任务中,也就是围棋,先后击败了两位国际顶尖的围棋选手——李世石和柯洁。然后在这个月,另外一家叫做open AI的人工智能公司设计了五个人工智能,他们参加了一个叫做dota2的团队竞技比赛。我相信大家很多人应该都知道dota2实际上是一个5V5的游戏,他们这5个人工智能和人类打了数千盘,胜率竟然能达到99%。更有甚者,在与去年的国际冠军的比赛中,他们也非常轻而易举的取得了胜利。所以现在人工智能的确是一个非常厉害的东西。

576168190.jpg

但大家可能会问,人工智能你说了这么多,给我们介绍的只是一个游戏,在现实生活中,人工智能到底能不能做得比人类好呢,或者说到底存不存在一些任务,人工智能做得比人类要好?其实是有的,在去年年底和今年年初的时候,荷兰举办了一个种黄瓜比赛,参与这个比赛的人有谁呢,有一些农民伯伯,也有一些IT的人士,比如说来自于国内的一些团队,像腾讯,也有一些来自于国外的团队,比如说微软,他们通过人工智能系统来远程地遥控在荷兰的园艺大棚,然后看和人类去竞争谁种得更好一点。结果出乎人们的意料,美国微软设计的人工智能系统去远程遥控荷兰的温室大棚,竟然取得了比荷兰的园艺专家更好的结果。

大家可能会奇怪,我们这是一个关于摄影的演讲,你来给我们讲这些是干什么呢?其实我个人是觉得,种黄瓜和摄影还是有一点联系的。大家可以看一下,我怎么来种黄瓜呢?我可以调节一下温度、湿度、光照和水分,看这几个变量的不同组合怎么样能够得到一个最高的产量。这个在摄影里,拍照片也要调节这几个参数,比如说我要调节光圈、快门速度、焦距,可能也要调一下曝光补偿。现在我们知道人工智能种黄瓜做得特别好,那么它拍照片能不能拍得很好呢?我们可以对人工智能提一点更高的要求,不仅要求它拍照,还要看人工智能能不能从无到有的生成一张照片。这里的从无到有的生成可不是PS,PS是基于一张真实的照片去改,从无到有的生成是说,由人工智能一个像素一个像素的生成一张足以以假乱真的照片。     

接下来我们做一个小游戏,我们看到这四张照片里面,有一些是由人工智能模型生成的“假照片”,而且有一些照片是由人类拍摄的真实的照片。给大家大概15秒钟的时间,然后大家举手投票,看这四张照片里,哪一张更像是计算机生成的,而哪一张更像是由人拍的呢?

576168170.jpg

我们从后往前来看,第四张这个汉堡的照片吧,虽然它看起来比较诱人,但实际上有一些细节还是比较模糊的,这张照片实际上是由计算机生成的。我们来看第三张照片,第三张照片是一个蝴蝶,有人可能会注意到这个蝴蝶翅膀的形状看起来有些奇怪,虽然是一些小的瑕疵,但是也足以证明这张照片可能不是人拍的,实际上也是计算机生成的。我们来看第二张照片,有观众可能觉得,:“我去年放假的时候正好去度假,大概就是这样的一个海岛,它一定是个真的。”但是真对不起大家,这个照片其实也是计算机生成的。我们最后来看第一张照片,这只狗双眼炯炯有神,而且这个焦外如同奶油般的丝滑。那这张照片,它是计算机生成的?还是由人拍的呢?它实际上也是由计算机生成的。换句话说,这四张照片没有一张照片是真的,这几张照片里面每一个像素都是假的。但从大家的反应我也可以看到,这些照片足以以假乱真。

现在大家的朋友圈可能会传一些照片,这些图片大家都会用PS,那么有没有可能,五年以后、十年以后,我们朋友圈发的照片,就不再是真实的、通过照相机拍的照片,而完全是由计算机生成的,足以以假乱真的照片。

576168139.jpg

如果有一天,拍照不再需要照相机

那么我再多问一句,如果有一天拍照这件事情不再需要照相机,而只需要一个算法去实现,那么在座的各位摄影师又将何去何从?其实如果认为这是一次人工智能对摄影的挑战,在历史上,这种挑战应该比比皆是。比如说我们拿绘画来举例,在中世纪的时候,绘画更多的是为宗教服务,它只需要去完整地描述一个宗教故事,这个时候,不管是对人物的描绘还是对细节的刻画都并不是非常完美的。

576168163.jpg

圣母领报

576168164.jpg

圣罗马诺之战 文艺复兴初期

我们举一个例子,中世纪有一幅画叫做圣母领报,里面会有一些奇异的东西。在文艺复兴初期的时候,我们可以看这张圣罗马诺之战,地面上的所有的棍棒以很大的概率无限地趋于一点,实际上就是说,那个时候作家已经会比较熟练地使用透视法,而透视法也是人类去观察世界的一个基本方式。


艺术家VS人工智能

576168165.jpg

库尔贝 | 邂逅 

我们把时间再往近来推,这个是现实主义画家库尔贝的一幅绘画作品,它的名字叫《邂逅》。我们从这个绘画作品可以知道它已经极近地接近我们现实生活。当摄影出现了以后,绘画的进步某种程度上得到了一次小小的挑战。为什么呢?因为摄影实际上能够极近地逼近一个现实的画面,这个是一个画家远远不能够做到的。所以摄影在过去的一段时间里,扮演了一个去挑战绘画的角色。那我们现在看到的人工智能,在某种意义上也扮演了一个想要试图去挑战绘画,并且挑战摄影的角色。那么存在一个问题,人工智能在过去的那么多的任务中都取得了胜利,那么在这个战场上,它有没有可能同样获胜呢?

我们需要看一下,人工智能曾经获得的胜利的根源是什么?比如说我们的两个例子实际上都是游戏里面的例子,在游戏里面的例子,对人工智能来说非常简单,我把这个胜率提高就可以。第二个情况去调节空调系统,那它的目标就是成本。这些背后都有一个量化指标,只要我把这个量化指标给定好了,人工智能系统就可以去找到一个更好的决策,然后采用这个决策,个人工智能就可以达到让量化指标最大化的目的。

现在很清楚了,如果人工智能要挑战摄影,或者是去挑战艺术创作的话,我们首先需要知道,作为一个照片来说,它应该用什么来量化?或者是说作为一个艺术品,它又应该用什么来量化?它到底应不应该来量化呢?


艺术的背后

其实不仅是这个照片和艺术,生活中的很多方面它都不一定可以量化。比如说我们就说黄瓜这个例子,比赛比的是产量,但是黄瓜真的只是产量吗?黄瓜它作为一个食物来说,它有味道、口感,又比如说这个黄瓜它不一定会作为一个食物存在,它也可以去保护我们的皮肤,那么这个时候,作为一个种黄瓜的任务,你真的可以做到让世界上所有的人都满意黄瓜的味道、口感和功效吗?那即使可以的话,这种东西该用什么来衡量呢? 

576168145.jpg

摄影师贺笛 | 拍摄于死亡谷

那我们把这种推演,推演到我们的摄影里面。这是我拍的一张照片,当时是在死亡谷的外面。那么我们看这张照片该用什么来衡量呢?难道是说,我这个曝光准确就可以吗?颜色一致就可以吗?还是说我保持水平线就可以吗?满足了这些条件就是一张好的照片呢?其实不是,我们每个人拍一张照片,一定有拍这张照片的意义,照片背后的东西才是这些张照片最重要的东西。

576168140.jpg

乔尔迈耶罗维茨 | 911

我们举一个例子,这是一张艺术家的作品,如果从表面上来看的话,就是一个废墟现场,可能代表着有一些火灾。那这张照片它要描述的是不是一场火灾过后的救援呢?其实不是。这张照片,是乔尔迈耶罗维茨拍的911的作品之一。当我们看到911这个词的时候,就知道这张照片所内涵的东西远远地大于他在这张照片中表达的东西,他实际上在描述一场人类史上最大的灾难之一。作为人工智能来说,它能不能知道这张照片背后的这种社会性呢?这个是值得商榷的。

576168141.jpg

  Jeff  Wall

我们再来看一个稍微有些抽象的例子,这个是Jeff Wall的一张照片,照片里面有一个男性、有一个女性,然后还有一个照相机。这张照片怎么拍的呢?这张照片实际上面对着一个镜子,照相机拍的是这面镜子反射出来的内容,所以也拍到了这个照相机的自己。那这张照片仅仅描述的就是一个照相机反射这样拍照的过程吗?其实不是,我们如果去拿绘画史上的一张图像来看,我们就会知道这张照片到底要表达什么?

576168142.jpg

马奈

这个是马奈的一幅作品,它的整个画面的正中间是一个女的服务员,然后我们可以注意到,在这个画面的右上方隐隐约约的有两个角色,一个是一个绅士,一个是这个服务员的背影。那我们其实就知道,这个图片正面有一个人物,她的后面有一个镜子,然后通过画家的眼睛去把这张照片画出来,画的是这个女服务生以及这个女服务生背后的镜子所反映出来的东西。

那么这个时候我们再看Jeff Wall的这张照片,就可以知道这张照片实际上是对马奈作品的某种回应。所以作为一个人工智能来说,它真的能够知道一张照片背后的摄影史和艺术史的观点吗?它其实也是不一定的。我们看了这些艺术家的作品,实际上我们每个人拍照,一定有我们背后的故事,即使像我这样的业余摄影师也是一样的。

576168143.jpg

摄影师贺笛 | 拍摄于马其顿

这个是我在马其顿拍的一张照片,马其顿是一个非常小的国家,这个国家也不是很富裕。我有一天开车到了一个荒郊野岭,当时有一个加油站,在那里我看到了一个比较有意思的元素组合:首先是一个非常荒芜人烟的地方,有一个近乎废弃的加油站,这个加油站的里边有一辆婚车,这个婚车还是加长版的,边上还有一个重型卡车。当时我就觉得这个画面元素非常的奇怪,我很难在一些国家见到这样的元素的组合:有一辆婚车在一个很偏僻的地方,并且还有一辆重型卡车。于是我把这幅照片拍出来,因为我觉得这幅照片里面蕴含的东西有一定代表世界的荒谬性,但是如果对于人工智能来说,它可能知道这些事物的存在,但是它能够知道这种事物的有机组合代表这种荒谬吗?这其实也是不一定的。

576168144.jpg

摄影师贺笛 | 拍摄于奥斯陆

这张照片是我在奥斯陆拍的。奥斯陆最著名的就是峡湾,在夏天的时候,大家会争先恐后地在峡湾里面游泳。当时我看到两个孩子在玩耍,正在准备往下跳,我就问他们愿不愿意在他们跳的过程中让我拍一张照片?实际上这个正在跳的孩子是一个很犹豫的态度,他犹豫并不是去犹豫愿不愿意被拍,而是犹豫用哪一种姿势。最终他选择了一个他认为难度最高,也是最有张力的姿势——一个前空翻,然后跳下。边上的人在他跳的过程中,也在跟他指着说:“你不能这样,你要看镜头!”我很庆幸能够拍下这张照片,因为我当时用的是一个手动对焦的镜头,虽然有一些瑕疵,但是很难得能够把这个镜头抓下来。但是作为人工智能来说,它真的知道背后的这些细节吗?它真的能知道我跟他们对话吗?可能这些都是很难知道的。 


事情真的只有0和1吗?

我就是一个纯粹学计算机的人,计算机就是二进制 0和1。所以在计算机看来,很多东西都是非0即1的,事物也是非对即错的。这个实际上跟科学史的发展比较吻合,因为一般大家都会认为,科学的发展史就是一部记载着人类如何去追求真理的历史。据说爱因斯坦临死前说了这句话:我会确信上帝是不会掷筛子的。也是因为他的这一句话,导致后面有非常多的科学家前仆后继去分析这句话到底是真还是假。因为他们相信这句话背后一定有一个正确的答案,上帝是掷筛子还是不掷筛子。但是我们回过头去看艺术史,艺术史里真的有真理这件事情吗?

我比较喜欢的一本艺术史的书,是贡布里希的《艺术的故事》。他告诉我一件事情是艺术史的发展实际上就是人类观念变化的发展,那么观念这个事情,它实际上也是没有对错的。你很难说今年流行的比明年流行的更好,你也很难说,十年以后流行的会比十年以前流行的更好。艺术更多的是记录了人类观念的变化,以及人类对世界理解的变化。从这里我们看到科学和艺术的着眼点是有一些区别的,甚至我也可以说,科学和艺术在某种意义上是对立存在的关系,但是你如果从这个角度来想的话科学和艺术实际上也有可能是互补的。

我记得有一次我去看一个展览——罗杰拜伦的《荒诞剧场》。我在那个展览上就觉得自己可以有办法把哲学和艺术在某种意义上统一下来,比如说我觉得,我对科学的了解,告诉我这个世界上有些东西,是有正确与否的话,那么实际上我对艺术的了解,更多的是告诉我,这个世界上有更多的的事物,它们本身是没有正确与否之分的。而对于它们,我们不能上来就批判,而是应该以一种适度包容、理解的态度去看待。因为人工智能是一个计算机的产物,所以对错这件事情人工智能可能可以告诉我们。但是人工智能它到底知不知道什么叫尊重?什么叫理解?什么叫包容呢?这个实际上现在我们并没有答案。 

以上就是我想讲的所有的东西,谢谢大家。


【图虫·Open See Talks】内容版权归作者及图虫团队所有

不得擅自转载或二次修改

转载/应征讲者/品牌合作 请联系:

duyang@bytedance.com