人工智能,如何妙笔“生”画******
核心阅读
输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。
不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。
一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?
从文本到图像,人工智能绘画本质是计算
人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。
设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。
今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。
具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。
扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。
“这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。
扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。
众多用户尝鲜,大量应用加速“画技”进化
汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。
随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。
大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。
不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。
但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”
防范潜在风险,守住法律和伦理底线
人工智能进入绘画领域,计算机会取代人类画师吗?
在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。
不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。
“人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。
不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。
不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。
记者 喻思南
一题而三命意的《伶官传序》******
作者:詹丹
欧阳修的史论名篇《五代史伶官传序》分别在中开头、中间和结尾,出现了三处观点句,即:
盛衰之理,虽曰天命,岂非人事哉
忧劳可以兴国,逸豫可以亡身
夫忧患常积于忽微,而智勇多困于所溺
对此,虽然有人曾提出哪一处是中心句的疑问,但也有不少学者把三处观点作了归并处理。如流行甚广的朱东润主编的《中国历代文学作品选》有关这篇作品的题解,就把三处观点整合在一起加以论述道:
这篇文章是把“庄宗之所以得天下与其所以失之者”作为教训,说明“忧劳可以兴国,逸豫可以亡身”,“祸患常积于忽微,而智勇多困于所溺”,指出一个王朝的兴亡主要决定于人事,在当时历史条件下,有其进步意义。
而陈必祥在《欧阳修散文选集》题解中论及此文时,把第一处观点句称为“全文的主旨”,把第二处称为“结论”,又把第三处称为揭示“带有更普遍意义的教训”,是“扩大和深化了主题”。只不过用换一种说法,依然对三处观点句作了归并处理。
不过,吴小如在1980年代论及该文的主题时,一方面归并处理了三处观点,但更重要的,他还有着深入一步的看法:
这篇文章的主题归纳起来不外这三层意思:首先是盛衰治乱兴亡之理,由于人事而未必由于“天命”,这是一篇的主干。其次,所谓“人事”,主要表现在两个方面:即“忧劳可以兴国,逸豫可以亡身”和“祸患常积于忽微,而智勇多困于所溺”。
虽然吴小如在提出主题的三层意思的同时,对内部关系做出了逻辑分析,认为第一处观点句“人事”是主干,后两处是“人事”的具体表现,大致体现出“总-分-分”这样的逻辑关系。但我的看法稍有不同。
从逻辑分类看,后两处的观点,确实都属于“人事”的范畴。但从观点的抽象到具体的递进程度或者说从“人事”的普遍性到特殊性看,其间的关系又是步步深入的。
由于第一处提出的观点“盛衰之理,虽曰天命,岂非人事”中的“人事”毕竟没有具体内涵,所以这是在一个宏观角度,提出了与“天命”相对的观点,来构成盛衰之理的具体内涵。也就是说,相对于纷繁复杂的“人事”来说,这个概念本身是抽象而又空洞的,只是当作为与“天命”对等的一个概念,把传统的认同“天命”的观念也向“人事”有所转向,才有其具体的针对性。
也正因为“人事”概念本身的抽象和空洞,所以它反倒像虚位以待的框架,可以容纳丰富的内容。其实,庄宗之所以失天下的原因本来就复杂,《旧五代史》在庄宗本纪最后评价说:
然得之孔劳,失之何速?岂不以骄于骤胜,逸于居安,忘栉沫之艰难,狥色禽之荒乐。外则伶人乱政,内则牝鸡司晨。靳吝货财,激六师之愤怨;征搜舆赋,竭万姓之脂膏。大臣无罪以获诛,众口吞声而避祸。夫有一于此,未或不亡,矧咸有之,不亡何待!
其罗列出的林林总总,所谓“咸有之”,正说明了这一点。当然“伶官传序”似乎更突出其重点,所以在林林总总的“人事”中,强调了人的行为上的“忧劳”和“逸豫”这一组概念对比。这样就把抽象的宏观的“人事”递进到相对具体的中观层面。这当然是有庄宗的具体行为可以呼应的,这里且举一事为例。
《新五代史》有记录说:
同光三年夏,霖雨不止,大水害民田,民多流死。庄宗患宫中暑湿不可居,思得高楼避暑。宦官进曰:“臣见长安全盛时,大明、兴庆宫楼阁百数。今大内不及故时卿相家。”庄宗曰:“吾富有天下,岂不能作一楼?”乃遣宫苑使王允平营之。宦者曰“郭崇韬眉头不伸,常为租庸惜财用,陛下虽欲有作,其可得乎?”庄宗乃使人问崇韬曰:“昔吾与梁对垒于河上,虽祁寒盛暑,被甲跨马,不以为劳。今居深宫,荫广厦,不胜其热,何也?”崇韬对曰:“陛下昔以天下为心,今以一身为意,艰难逸豫,为虑不同,其势自然也。愿陛下无忘创业之难,常如河上,则可使繁暑坐变清凉。”庄宗默然。终遣允平起楼,崇韬果切谏。宦官曰:“崇韬之第,无异皇居,安知陛下之热!”由是谗间愈入。
在这里,身为一国之主不顾民间疾苦而只想着自己安乐,庄宗过往忧劳与当下逸豫的鲜明对比,成为一种身体的真切感受,而不听忠臣进谏、尽受小人蛊惑,常常又是关联在一起的。《资治通鉴》也记录了这一史事,胡三省加注感叹说:“郭崇韬之言,其指明居养之移人,可谓婉切,其如帝不听何!”
此外,观点句中,“兴国”和“亡身”对举,“国”和“身”还有互文足义的意思,所以文章最后提出庄宗“身死国灭”,就有了词语肌理上前后呼应的连贯性。
值得注意的是,虽然庄宗后来的“逸豫”事例斑斑可举,但文章从《尚书》中的“满招损谦受益”引出该文的观点句“忧劳可以兴国,逸豫可以亡身”,还是说明这种现象具有相当普遍性。这样,把这种虽然具体但依然普遍的观点,推进到庄宗个人境遇的特殊性,也就是作为“序”而指向“伶官传”的特殊性,所谓“忧患常积于忽微,而智勇多困于所溺”,这是呈现第三处观点句的意义所在。相对第一处的宏观和第二处的中观来说,这第三处的观点句,就是微观了(尽管结尾的“岂独伶人也哉”一句,显示了作者也努力要把这种特殊的微观回扣到普遍性中)。
在以“宏观”“中观”和“微观”理解三处观点句的递进关系时,我们都是以“人事”为立论前提的。在这过程中,作者所谓的“虽曰天命”一句,似乎被抛到了一边。我们固然可以说,作者强调了人事的重要性的同时,并没有完全否认“天命”的存在,但其向下文延伸的肌理性关系,似乎已经被我们无视。我们没有意识到,在其论述的递进过程中,那种似乎已经隐身的“天命”意识,其实际内涵已悄然发生了改变。
许多人在强调第二处观点句时,无意中遗漏了“忧劳可以兴国,逸豫可以亡身”的后一句“自然之理也。”而这似乎从“人事”中逸出的,这不能被主观世界完全掌控的普遍性、规律性之理,以颇为“自然”的方式出现,使得我们忽视了其存在。而这,恰恰是能够跟同样不受人的主观控制的“天命”互为相通,形成一种肌理性联系。
日本学者沟口雄三在谈到唐代向宋代有关天的观念变化时,认为是从“天谴的天向天理的天的变化”,也就是“主宰者的天向理法的天的变化”。唐以前的人们习惯认为,作为主宰者的天似乎有着人格意志,可以借助自然灾害,对君王犯下的错事做出谴责,以提醒君王纠正过错,所谓“天谴事应”。此类观念到宋代已经受到了不少学者的挑战。欧阳修和宋祁主持编撰的《新唐书》,就讨论了“天谴事应”的问题,并对此有所质疑。在“五行志”中,认为后世之人是在“曲说而妄意天”,所以他们编写的体例就“著其灾异,而削其事应。”而《五代史伶官传序》中提出不受人意控制的自然之理,正是从“天命”向“天理”过渡的桥梁。当天理内在于人事中(这被沟口雄三称为“欧阳修的天地人之理”)得到理解,成为一种规律时,认识到这种规律、这种天理的存在其实只是一件稀松平常的事。不过,当人们总是通过自己的言行来反复证明这个规律的存在,不断重蹈覆辙时,才是一件使人不胜感叹的事,也难怪欧阳修会在他的史论中,常常劈头就感叹一声:“呜呼!”
(作者单位:上海师范大学光启语文研究院)