能缩书会写作,还可以评选人类作品:AI能为文字与文学带来什么?
《思南文学选刊》2019年1月号刊登了一份特别的文学“AI榜”。在这份AI最喜爱的作品榜单中,科幻作家陈楸帆去年发表于《小说界》杂志6月刊上的短篇小说《出神状态》以0.998941845的系数位列第一,以0.000001的优势险胜莫言发表于《十月》杂志2018年1月刊的《等待摩西》。
这是《思南文学选刊》与一个名叫“谷臻小简”的AI软件合作完成的榜单,也是目前中国文学领域发布的首份AI榜单。AI软件在“阅读”了2018年中20本文学杂志刊发的全部771部短篇小说后,挑选出了它最喜欢阅读的一批作品。据软件开发者、前《收获》杂志编辑走走介绍,AI算法看重的是小说的优美度,即情节与情节之间的节奏变化的规律性,以及结构的流畅程度。同时,由于目前的AI程序引进了概率算法,因此它是根据杂志的最大风格来做出判断的,也就是说,AI会在最专业的杂志中选择出一批最专业的作品,当然这也就意味着,它也会在最通俗的杂志中选出最通俗的作品。
截至2019年1月20日,“谷臻小简”的最爱读物始终是莫言的《等待摩西》。然而,21日下午3点左右,参与此次评选的《小说界》和《鸭绿江》杂志的作品赶到,新增80部短篇小说。下午7点20分,情况发生了改变。AI最终选定的年度短篇是陈楸帆的《出神状态》,《等待摩西》被挤到了第二位,位列榜单第三的是作家雍措发表于《青年文学》杂志的小说《午后阳光》。
在这份收入了60位中国作家及其小说的榜单上,既有我们熟悉的身影,比如获得过诺贝尔文学奖的作家莫言、前段时间在“匿名作家计划”中进入终选的青年作家叶扬(独眼)、短篇小说《刺杀小说家》正被改编为同名电影的热门作家双雪涛、科幻作家宝树,以及在文学圈内时常被认为小说十分“符合《收获》调性”的张楚。当然,榜单也涵盖了一批并没有怎么进入大众读者视野的作家。看到这份榜单呈现的结果,走走也在考虑接下来应该如何完善算法——一方面,她希望AI能够挑选出质量上乘的作品;另一方面,她认为不能完全用《收获》的风格去要求AI。
《思南文学选刊》主编黄德海对于这份榜单呈现的中立结果很感兴趣。他在接受界面文化(ID:Booksandfun)采访时表示,当初决定收录这份特别的榜单,一方面是因为AI发展迅猛,想看看AI在文学方面能够创造出何种可能性;另一方面则是因为每到年末岁尾,文学圈就涌现出一堆文学排行榜——不管评选结果如何,总有人质疑评委的专业度,又或者认为评选结果依赖的是人情——“那么,一个相对中立的选择标准,会是比较好玩的吧?”
《思南文学选刊》
有趣的是,作为AI最终选定的年度短篇作品,陈楸帆的《出神状态》里恰好也用到了由AI软件生成的内容。AI从众多作品中识别出了另一个AI,“这简直是生成整个榜单过程中最华彩的部分,”走走在接受界面文化采访时说到。出于好奇,她在榜单结果出来后马上打开了陈楸帆这篇小说,留意到结尾有这样一段注释:“带*号楷体字部分为AI程序通过深度学习作者风格创作而成,未经人工修改。”
她立即联系了陈楸帆,询问这个注释究竟是一种噱头,还是真的包含AI写作内容。他当即把自己使用的AI软件发给了走走,这个软件是他的朋友、创新工场CTO兼人工智能工程院副院长王咏刚制作的,训练数据包括陈楸帆既往的十几部小说作品,以及作为参考语料的赫胥黎、阿瑟·克拉克、威廉·吉布森、尼尔·斯蒂芬森等人的科幻小说作品。第一次看到AI程序写出来的句子时,他觉得既像又不像自己写的,有先锋派的味道。制作者王咏刚特别喜欢机器写出的“重重追逐着人类发现的触觉,以及即将看清左右的囚笼”这一句,因为看上去“像是得了上世纪八十年代朦胧诗派的真传”。除了参与AI评选的《出神状态》一文,在日前出版的新书《人生算法》里,这个AI程序也与陈楸帆进行了互动。
“一个AI,何以从771部小说中,准确指认出另一个AI的身影?”走走在随榜单一同发布的《未知的未知——AI榜说明》一文中发问。陈楸帆则感慨说,“这简直比科幻还科幻。”AI程序已逐渐习得了陈楸帆的写作偏好——在使用祈使句时爱用什么句式、描写人物动作时喜欢用什么样的形容词或者副词等等。在掌握了关于语句的统计规律后,在写作环节,AI程序便会从大量的语料中随机找到一些词,并把这些词汇按照写作规律拼接在一起,形成句子。当陈楸帆被问到是否担心AI程序有一天会写出比自己更好的作品,他幽默道:“这倒不会,要是真写出来我就躺赚了。”王咏刚也在近期上海的一场讲座中提到,目前AI写作程序仍然只是一种“初级的机器辅助写作”,即通过给定关键词和关键元素在数据库中进行检索,找到历史上所有涉及这个词语的文本。这也导致目前AI写作有篇幅限制,而且在涉及句与句、段与段之间的关系时,AI便有点捉襟见肘了。“AI现在还是个baby,”走走对界面文化说。
《人生算法》陈楸帆 著中信出版社 2019年1月
除了为影视改编服务之外,走走发现,这个小说软件也可以指导一部分学生进行写作。目前她的团队正在尝试和上海视觉艺术学院合作,这是中国第一所开设网络文学创意写作本科教育的大学。学生创作的网络小说被输入软件后,AI会按照理想的故事模型和情节曲线对故事进行检测。“比方说一个W阵型,如果W的第一个弯度不够,那就是这个人的命运不够悲惨,那么它上升的曲线就不够大,故事就不够精彩。我们也有剧本算法,目前我们针对的是电影,不是电视剧。针对电影来讲,就是可以判断哪一幕写的比较平、哪一幕写的比较精彩,这些都是可以调整的。”
走走2017年底从《收获》杂志辞职,开始涉足影视版权转化工作。她随后发现,即便是如余华、须一瓜这种在文学圈颇有名气的作家,在影视市场上的认知度可能还比不过网络文学。这激发了她对网络文学的兴趣。在浏览各大平台网络文学的过程中,她惊叹于网络文学动辄三百万字、五百万字的体量,于是想到了一个“偷懒”的办法:开发一个能够迅速读取小说并且提取简介、人物和情节的软件,并将这样的分析报告提供给影视开发方供其参考,以便进行迅速判断,这便是“谷臻小简”AI软件的由来。
另一方面,她也很清楚AI的局限。“我们现在没有办法教人工智能识别语言的好坏,即便是人,我们也很难教会他们识别语言的好坏,我们无法评判是王朔的语言好,还是余华的语言好。AI能够识别的是节奏感、叙述的强弱、泪点笑点的分布以及整个结构是不是工整。事实上,意识流小说、多视角、平行空间等等各种文本的技巧并不适合影视改编。影视改编基本上还是线性结构为主,顶多就是一个倒叙。因此影视改编的路线是很清晰的,所以这个AI也比较笨,是围绕这个方向来选小说的。”
在去年的西湖IP大会上,由谷臻故事工厂联合浙数文化东方星空数娱发布的《卖座故事曲线报告》中,AI研究和分析了过去20年间724部改编成影视的文本,通过分析小说的主题、情节、人物以及有关小说风格和设置的各种变量,探讨了影视作品畅销的内在元素。除了根据文本中出现的人物和场景来识别主角、主角之间的强弱关联以及主要场景,另一个对AI来说非常重要的判定因素是情节曲线。据走走介绍,情节曲线的计算是根据文本中的动词进行统计的。“情节是冲突造成的,冲突是通过动词呈现的。在影视作品里,冲突是要通过演员的动作来呈现的,所以主要的东西一定是动词和动作的权重。因此情节曲线主要是根据动作权重来计算的。”
谷臻故事工厂分析得出的人物互动关系图
AI统计得出结论,能被改编的文学作品有强情节、几个引人注目的人物和一个中心主题。通过分析724部作品,AI得到了六种类型的故事曲线(W型、M型、N型、倒N型、V型和倒V型),其中W型比例最高。这种类型往往首先是一个正能量故事,故事初期主角略被动,但结局一定是乐观的,情节起伏均匀对称,节奏感强——《琅琊榜》和《香蜜沉沉烬如霜》都属于这一类型。
这种通过机器评定和操作的模式化指导,是否会损害文学本身?对此,做纯文学出身、并认为自己有一颗纯文学之心的走走说,目前AI写作程序主要面对的是靠故事情节取胜的网络文学,而非纯文学。她认为,在不久的将来,AI写作程序极有可能取代网络写手,自己生成符合观众胃口的网络文学作品。
除了应用于影视改编外,走走希望未来可以利用这个AI软件搭建一个荐读平台。目前软件的读取速度已经达到了平均四秒钟一本书,“我希望为中国所有的图书都做一个导读版,相当于建立一个百科全书式的图书馆导读系统,从而进行通识教育。”读者在看过导读版之后,可以自行判断一本书是否有干货,是否要购买这本书进行深度阅读。
当被问及这项服务和如今盛行的《罗辑思维》这类抽取干货的读书产品有何不同时,她认为,人工拆书存在一定的主观性,受个体视野和知识格局影响较大。并且,目前的人工拆书产业链条建立在对于廉价劳动力的压榨之上——通常是经过大学生之手进行拆解,然后流转到行业大V手中。“这种行为不尊重图书,也不尊重作者。如果是作者自己去讲解,我是认可的。但这种拆书行为仅仅是为了提高效率,是为了挣钱。”走走在解释二者的区别时说,“我们不是要代替这本书,而是提供一个进阶的选择——可以通过导读版给读者一个浏览经验,然后他们决定要把哪本书带走、要不要继续去了解一本书。”
附:AI榜单前十名
序号 作者 篇名 杂志 系数
1 陈楸帆 出神状态 小说界2018.6 0.998941845
2 莫言 等待摩西 十月2018.1 0.998931
3 雍措 午后阳光 青年文学2018.2 0.998853945
4 吴祖丽 总有一些事情在摧毁我们的生活 鸭绿江 2018.11 0.998611625
5 巴陇锋 乌兰察布之恋 延河2018.12 0.998564063
6 凌岚 枪与玫瑰 青年作家2018.2 0.9982574
7 刘亮鱼 花飘香 文学港2018.7 0.998156059
8 叶扬 预展 小说界2018.2 0.998151156
9 杨则纬 爱人 鸭绿江2018.5 0.998086753
10 卢德坤 恶童 西湖2018.2 0.997280721
(来源:界面新闻)