炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:果壳)
2024 年冬季的一个深夜,当我百无聊赖地刷着社交媒体时,一条“邪修副业”的帖子让我瞳孔地震。
“不需要文笔,不需要逻辑,我用 ChatGPT 写小黄文,月入 1W+。”
我的第一反应是:这也行?
注意:并不是在教你走偏门!|Google
但转念一想,这简直是商业奇才啊。生成式 AI 刚刚爆发,AI 写专业论文费劲,但写“小黄文”绰绰有余。毕竟大家看小说是来追求肾上腺素的,谁会去细扣文笔、情节连贯性和世界观设定呢?
即便如此,那时的我也曾以为这不过是一群搞“灰产”的人在角落里薅点时代羊毛罢了。
两年不到,AI 写书已经从小作坊模式演变成了庞大而强力的产业集群——在亚马逊的 Kindle 商店里,如今最勤奋的“作家”是盯着讣告栏的爬虫脚本。
大批 AI 生成的垃圾书籍充斥在亚马逊热销榜单,甚至公共图书馆上,和我们曾经纵容并享受人类自制造的内容垃圾一样,如今我们可以大口吞咽 AI 制造的屎了。
当 AI 成为最勤奋的畅销作家
《滚石》杂志记录下了这样荒诞的一幕:当美国前国务卿亨利·基辛格或《老友记》主演马修·派瑞去世的消息刚刚传出几小时,亚马逊上就会凭空冒出几十本关于他们的“最新传记”。
你能分辨出哪本是官方自传,哪本是由 AI 生成的吗?|Amazon
这些书通常有着甚至连名字都拼不对的廉价封面,简介里充斥着“深入揭秘”、“独家视角”等吸睛词汇,如果你不幸花钱买下来,翻开一看,就会发现里面全是无限循环的车轱辘话。
其背后的原理很简单:黑产脚本全天候监控新闻网站,一旦捕捉到“Obituary”(讣告)或“Death”(死亡)等关键词,就自动触发流程:抓取维基百科生平,喂给大语言模型,要求其“扩写成一本 100 页的书”,自动生成封面,自动上架。
整个过程或许只需要人类点击一下“确认”。由于速度太快,有时候家属的悼词还没写完,亚马逊上的 AI 传记已经卖出几百本了。堪称“赛博盗墓”。
活人也逃不过这场“围剿”。
美国著名科技记者 Kara Swisher 在 2024 年初推广自己的回忆录 Burn Book 时,就遭遇了一场荒诞的狙击。
当她在亚马逊搜索自己的新书时,排在前面的竟然不是她写的书,而是一本名叫 Kara Swisher: Silicon Valley's Bulldog 的冒牌货。
这本“书”只有77页,封面透着一股廉价的蜡质感,作者名为“Jane Coelho”,如果你搜,会发现根本查无此人。书里的内容更是离谱,不仅充满了从维基百科胡乱拼凑的车轱辘话,还利用 AI 幻觉虚构了大量她从未做过的事。
围绕 Kara Swisher 假书不止一本|404 Media
这一次,AI 显然惹错了人。Kara Swisher 直接掏出手机,给亚马逊 CEO Andy Jassy 发邮件写道:“What the f*ck? 把这些垃圾撤掉。”
Kara 在节目中不禁后怕:“如果连我都得找 CEO 才能解决问题,那普通作者该怎么办?”
此前,著名的科幻杂志 Clarkesworld (曾出版《三体》英文版)的主编 Neil Clarke 被迫关闭了有着十几年历史的投稿通道。原因无他:他们在一个月内收到了 500 多篇由 AI 生成的垃圾小说。
AI:烂书,人写得,我写不得?
AI 乱写的书有些只是为了骗钱,有些却能害人。《卫报》和相关的真菌学专家曾发出过严厉警告,亚马逊上充斥着大量 AI 生成的蘑菇采集指南。
在这些书里,AI 不仅无法准确区分美味的牛肝菌和致命的鹅膏菌,甚至会凭空捏造出一些不存在的鉴别特征。至于这玩意儿吃下去会不会让人见太奶,你不言,它不语。
《芝加哥太阳报》此前刊登过一个“2025 年夏日书单”,结果入选的书大量是 AI 套用真实作者名字后写的假书|Bluesky
看到这里,你可能会有一个巨大的疑问:为什么这些书烂得像一坨浆糊,却依然能通过审核,甚至看起来像模像样?
因为制造这些垃圾的人,实则精通另一门学问——SEO(搜索引擎优化)式写作。
他们非常清楚,这些垃圾书籍压根就不是写给人类看的,而是写给亚马逊的推荐算法和谷歌爬虫看的。
在亚马逊 KDP(Kindle Direct Publishing)这样的自助出版平台中,审核标准只能做到“合规”,远做不到“质量”这一层。
亚马逊的自动审核机器人非常擅长抓两样东西:违禁词(色情、暴力、仇恨言论)和抄袭(与数据库中现有书籍的重复率)。
这不巧了吗?
AI 可以通过提示词避开敏感词,同时,AI 擅长把喂给它的数据,嚼碎,再吐出来——生成正确又无尽的废话。生成一本“全新著作”,应付传统的查重算法,绰绰有余。
换人类审核能解决问题吗?
众所周知,“AI 泔水”,量大管饱。每天数以万计的新书上传量,远远超过人类审核员的工作量。
AI 假书让平台算法和人类审核员都无法招架。现有的规则十分暧昧,人类写一本狗屁不通的自传,和 AI 写一本“吃毒蘑菇能延年益寿”的指南,并无差别,平台敞开了大门,读者需要擦亮眼睛。
造粪流水线,远比你想象得成熟
如果这仅仅是个人的投机倒把,或许还不足为惧。但现在的情况是,制造“赛博泔水”已经进化成了一条高度工业化的黑色产业链。
在这条流水线的上游,站着一群号称“卖铲子的人”。
在 YouTube 或 TikTok 上随手一搜“KDP Passive Income”(KDP 被动收入),就有无数“导师”兜售几百美元的课程,教你“如何用 ChatGPT 每天 20 分钟,躺赚 2000 刀”。有句话怎么说来着?教你赚钱的人,实则想赚你的钱。
再提示一遍,本篇文章并不是致富教程!|Google
一旦一本畅销书火了,黑产立刻跟进,生成它的“复刻版”、“总结版”、“精华版”等,封面配色和原书极度相似,专门收割那些眼神不好的老年人或想“速通式阅读”的读者——“精华版”好听点来说,叫“AI 伴读物”,实则就是正版书的“寄生兽”。
一般来说,AI 生成的书长达几千页的废话。因为在亚马逊的图书订阅服务 Kindle Unlimited(简称 KU)上,作者的收入是按读者阅读的页数计算的。
如果读者打开后立马关掉,通常带来的收益极低。所以这些书通常做得极长,在目录就用诱导性链接让读者直接跳转到书的末尾,或者干脆使用机器人账号刷阅读页数。
AI 写完了书,没有签售会,没有大佬推荐和站台,怎么卖出去?这就到了下游的刷单环节。
为了让垃圾看起来像畅销书,黑产从业者组建了庞大的“互刷好评联盟”:你帮我的假书刷个好评,我也帮你的刷。
更高级的玩法是直接上 AI 机器人,AI 写书,AI 读书,AI 写好评,也算是闭环了。只不过,在这个闭环里,只有一种东西是真实的:被骗进来的人类读者,以及他们付出的时间和钱。
自己拉的自己吃
如果你认为,受污染的只有亚马逊等在线平台。你错了,这桶“AI 泔水”早已冲到了公共图书馆。
在北美,许多公共图书馆依赖 Hoopla 或 Libby 这样的数字服务商来提供电子书借阅。为了让馆藏看起来足够丰富,这些平台的采购机制往往带有“自动抓取”的属性。
首当其冲的是图书管理员。他们在 Reddit 和 404 Media 上爆料,他们在后台看到大量 AI 写的书,封面诡异、内容空洞。而他们却对此无能为力。
劣币驱逐良币|Reddit
ISBN(国际标准书号)是每一本书独一无二的身份证。但黑产为了伪装正规出版物,开始大量盗用或乱填 ISBN 号。
于是这些垃圾数据就混入了图书馆检索系统,这下李逵和李鬼也分不清了。
关于“互联网继续充斥 AI 垃圾,将走向什么结局”这个问题已经被多次讨论。
现在的 AI 之所以强大,是因为它们是在互联网上几十年来人类积累的高质量文本,比如维基百科、经典书籍、新闻报道上训练出来的。
但是,随着 AI 垃圾书籍泛滥,下一代 AI 模型,将不得不用这些“赛博泔水”进行训练。输入决定输出。
而人类想要在互联网上获取一条高质量的信息,成本将被无限拔高。“100% Human Written and Checked”(本书由 100% 真实人类撰写并核对),也许将会成为一本书籍最为难得的标签。
参考文献
[1] https://www.404media.co/ai-generated-slop-is-already-in-your-public-library-3/
[2] https://www.theatlantic.com/technology/2026/01/ai-memorization-research/685552/
[3] https://slate.com/culture/2024/11/amazon-side-hustle-books-literature.html?
[4] redirect_uri=https%3A%2F%2Fslate.com%2Fculture%2F2024%2F11%2Famazon-side-hustle-books-literature.html%3Fpay%3D1761236181321%26support_journalism%3Dplease
[5] https://news.bloomberglaw.com/ip-law/fake-books-on-amazon-drive-authors-to-shield-their-names-from-ai
作者:糕级冻雾
编辑:沈知涵