历史
老鹰吃小鸡 > 人生算法 > 序 人类最后一个独立写作的纪元

序 人类最后一个独立写作的纪元(3 / 7)

与后四十回文本异同年代,计算机对于文学创作、文学评论镜鉴价值就已经模糊地显现出来。今天AI工具拥有比单纯词频统计更强能力。例如,自然语言处理中常用语词表征学习技术Word2vec就是这个探索方向上种基本工具。有关Word2vec个通俗解读是,当机器利用此工具计算出文本中每个语词对应神秘数值[7]后,可以巧妙地将神秘数值与语义联系起来,甚至可以用直观计算式来进行语义推导(们用加方括号词来表示该词对应神秘数值):

[皇帝]–[男人]+[女人]≈[皇后]

[北京]-[中国]+[澳大利亚]≈[悉尼]

上面两个非常直白计算式对AI研发者而言早已司空见惯,但每次展示给没有经过编程和算法训练人,还是会收获莫名惊诧。因为这样明显语义关系完全由AI算法自动得出,这很难不让人怀疑AI已经找到解读人类大脑密码。遗憾是,科学逻辑并不支持这样假想。今天Word2vec只是种应用于文本数学工具,AI对语义解读,还只停留在肤浅统计建模层面,远谈不上理解人类语言。

Word2vec实用价值在于,它是主题、风格、情感等更高级建模或分析基础。曾抽取楸帆作品中代表性较强词汇,计算得到每个词对应Word2vec向量数值,再通过数学变换将百多维空间中向量转换成二维或三维人类可见图像[8]——这是标准、科学意义上“降维打击”。例如,后图(见下页)是从楸帆收录在这本书中六篇小说文本中,抽样提取代表性词汇生成空间分布示例(不同小说中语词在图中对应于不同形状标记)。

在电脑上,类似分布图可以针对每个空间局部或每个聚合主题,进行放大和细化。词汇在不同空间层级、区域聚合关系,可以直观地反映每篇小说、每个章节甚至每个段落写作特点。类似工具还可以很方便地比较不同作家文本差异。例如,们完全可以将楸帆《人生算法》和保罗·巴奇加卢皮《卡路里人》进行类似主题分析和词汇比较。再例如,即便们知道楸帆《美丽新世界孤儿》是向赫胥黎《美丽新世界》致敬作品,但精密文本分析也足以向们呈现出两部作品在语汇和主题层面异同。从这个意义上说,未来文学批评领域文本比较,几乎定会演进成全面由计算机参与、逻辑缜密科学过程。

《人生算法》六篇小说文本中抽样词汇生成空间分布示例

惧怕科技工具人常常

请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。

排行阅读

苍白爱情

三秋泓
天之骄子渣攻X自卑怯懦美人伪骨科年下宋知雨寄人篱下,为了苟活,主动变成了继弟严越明最喜欢的床上玩具。注意:没有排雷,到处是雷。自带扫雷系统,谢谢。
这是一个理智与情感的故事。关于梦想,人人夸夸其谈;关于爱情,人人缄默不语。我爱你,更爱我自己。 名校毕业工作能力出众的纪星因为不堪职场骚扰辞职创业,一路挫折不断,却因投资人韩廷的指导和提点而渐渐褪去生涩,变得成熟。 事业开始顺利时,与男友的感情却走到尽头。她与韩廷之间也渐渐产生暧昧,关系发生改变。

秋以为期

桃千岁
军二代攻 X 黑帮老大受,强强,肯定有反攻。《无地自容》系列文。军二代和黑帮老大的强强对决。主角:柯明轩,边以秋。是否互攻,看我心情,反攻是一定有的。
我深深地爱着你,你却爱着一个傻逼,傻逼他不爱你,你比傻逼还傻逼,爱着爱着傻逼的你,我比你更傻逼,简单来说,本文讲述一个,谁比谁更傻逼的故事。

相爱未遂

金陵十四钗
满城衣冠副CP,律师X检察官,破镜重圆本文第一人称,互攻。

职业替身

水千丞
周翔不知道老天爷给他第二次活的机会,究竟是额外照顾他,还是没玩儿够他,否则他怎么会戏里戏外、前世今生,都被晏明修当成同一个人的替身?他也不知道他和晏小少爷,究竟是谁比谁更可怜,一个只能当替身,一个只能找替身。
最新小说: 路人甲和豪门大佬联姻后 乌衣巷 我在狗血文里反虐四个渣攻 第一和做一不可兼得 穿到虫族开局捡垃圾 被宠坏的病美人 匹配到顶级Alpha后马甲掉了 陆队今天真香了吗 你长本事了 笨美人自以为心机深重