炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:虎嗅APP)
出品|虎嗅科技组
作者|SnowyM
编辑|陈伊凡
头图|AI生成
“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「32」篇文章。
在今天这个AI“淘金热”的时代,所有人的目光都聚焦在那些更智能、更强大的大语言模型上。
然而,大多数人都忽略了一个房间里的大象:如果AI吃的是“垃圾”,那么它吐出的也必然是“垃圾”。
在B端企业中往往会有超过80%的数据,被“锁”在PDF、扫描件、表格和演示文稿这些“混乱”的非结构化文档中。
传统的OCR工具在处理这些文件时,会“弄乱”布局、破坏表格,导致下游的LLM产生“幻觉”。这在金融、医疗或法律等严肃场景中往往是不可被业界接受的。
而在硅谷,一个可能会终结“垃圾进,垃圾出”问题的初创企业,叫 Reducto AI。
这家公司在没有任何营销的基础上,用了 18 个月就融资 1.08 亿美元,约合人民币7.6亿元,而其快速的融资速度,即便是在爆火的AI热潮下,都十分少见。
嘉和资本CEO袁子恒告诉虎嗅,文档解析类产品,能做和做好的差别很大,因为B端客户需要的是高精度,特别是文档布局的表格、复杂公式识别。这也是Reducto AI能够迅速脱颖而出的优势。从产业链定位来看,非结构化数据解析平台偏infra层。也就是说,更像是个“卖铲人”。无论AI营销、AI客服、AI财务、AI研发、AI HR,AI供应链等等,都离不开底层的结构化数据。所以市场规模很大,全球市场超千亿美金,还在以超过40%的速度高速增长,因为企业的数据80%以上是非结构化数据,还在持续增长,这些非结构化数据都需要处理成高质量、结构化、AI可以使用的数据。而从用户需求来看,数据没有AI-Ready是目前国内外企业落地AI和构建自有知识库的最大障碍,“痛点很迫切”。
Reducto AI成立于2023年1月,起初只是一家两人团队的初创公司,在短短18个月内,它相继获得了硅谷“名人堂”的重注(虎嗅注:硅谷工程师协会(SVEC)于1989年成立,该协会自1990年开始设置硅谷名人堂。 硅谷工程名人堂旨在记录那些在专业领域取得了杰出成就的工程师和技术领袖们。 从1990年以来,有超过97个人入选该榜单。 最近一次是NVIDIA 的首席科学家 Bill Dally。 他在斯坦福大学工程学院的流处理研究成果帮助推动了 GPU 计算的发展,掀起了 AI 革命。)
从2024年起,Reducto凭借其API优先(API-first)的文档AI平台便开始吸引全球顶级投资机构的目光。
顶级VC们在极短时间内接力领投,反映了他们对这样一个“品类定义者”公司的极度FOMO(恐慌情绪)。其A轮(2025年4月)和B轮(2025年10月)之间仅隔5-6个月,还触发了B轮领投方(a16z)的“抢先下注”(Pre-emptive Round)。First Round(顶级种子)、Benchmark(顶级A轮)和a16z(顶级B轮)这三家风格顶尖的机构相继成为Reducto的“第一大外部股东”。
到2025年10月,Reducto的累计融资额已达到1.08亿美元。
这里有个很好的小故事,足以证明Reducto的融资速度,其CEO Adit Abraham曾在播客采访中透露,当Reducto还只是一个两人团队时,Benchmark的Chetan Puttagunta就主动与他们沟通,建议进行A轮融资。
这种“反向推销”的现象,充分反映了Reducto在硅谷的影响力。
Reducto到底造出了什么,能让全美最大的孵化器——YC社区的早期用户惊呼“比亚马逊的AWS还好”?
Reducto的产品形态是一个API优先的文档AI平台,辅以一个名为“Reducto Studio”的交互式工作区,供团队构建、评估和部署数据管道。
它不是一个单一的工具,而是面向开发者的“工具箱”。其核心API矩阵构成了一个完整的工作流,大致由 4 种 API 组成,我们做了整理:
Parse API(解析):作为Reducto的基础,Parse API将复杂文档(如PDF、图像、表格)转换为包含文本、表格、图形及布局信息的结构化输出。
Extract API(提取):基于Parse API,允许用户通过提供JSON Schema或自然语言提示,从文档中精确提取结构化字段。
Split API(拆分):将长文档(如1000页PDF)智能拆分为语义上有意义的“块”,为下游RAG应用优化上下文。
Edit API(编辑):Reducto的“核心”,是行业首个AI文档编辑API,允许AI“回写”或填写文档中的空白、复选框和表格。
在API层之上是Reducto最核心的Agentic OCR框架。
由于Reducto的技术哲学是“像人类一样阅读”,采用“视觉优先”方法,将PDF视为包含丰富上下文的视觉对象,而非纯文本流,所以他们创新性地采用了Agentic OCR工作流,大致如下:
首先,“传统CV(计算机视觉)”模型首先介入,对文档进行视觉分解,理解文档的整体布局,捕获区域、表格、文本块。
接着,“VLM”模型介入,在上下文中解释每个区域,将标签(如“发票号”)与数值(如“INV-123”)智能地关联起来。
最后,由Reducto的护城河技术:Agentic VLM 智能体模型,像一个“人类编辑”一样,自动审查和纠正前两遍输出中可能存在的微小错误。
这个“AI监督AI”的系统使Reducto在长尾边缘情况(如复杂表格、手写体、低质量扫描件)中仍能保持高准确率,避免了传统OCR/VLM解决方案中的人工审核问题。
这个“多遍自修正”系统,通过AI智能体替代人工审核员,自动化质量保证(QA)环节,从而实现极高的准确性。
用Reducto自己的话来说,这叫做“提供真实来源”。
这就是革命性的地方。
传统OCR/VLM的解决方案是“人在回路中Human-in-the-Loop”(HITL),即模型无法处理时,将任务发给人类审核员。这既慢又贵。
Reducto的“Agentic OCR”用一个“AI质检员”取代了“人类审核员”。这是一个“AI监督AI”的自修正系统。这就是为什么他们能实现“99%+”的准确性。
凭借这样的核心产品技术,Reducto的增长堪称“闪电战”。在参加2024年初的YC W24批次期间,Reducto完成了从“LLM记忆”到“文档AI”的关键转型。
Reducto在核心产品(Parse API)发布后的6个月内,ARR从0增长到“7位数”,超过100万美元。
在2025年10月的播客采访中,CEO Adit Abraham分享了通过“创始人主导销售”(Founder-led sales)实现ARR突破500万美元的经验。
除了ARR,其他增长指标也相当亮眼。
到2025年4月A轮融资时,Reducto已经处理了“数亿页”文档;而在2025年10月的B轮融资时,累计处理量超过了“10亿页”。在A轮到B轮的短短5-6个月内,月处理量增长了6倍。
此外,Reducto还表现出了极高的资本效率。CEO Adit Abraham在播客采访中多次强调,公司在筹集了1.08亿美元后,到2025年10月为止,仅“烧掉”了100万美元。
“筹集1.08亿,只花100万”表明Reducto的产品市场契合度(PMF)极强,团队也非常精干。Adit也表示这笔钱,将全被用来在AI人才战中不计代价地招募到最顶尖的博士,并且用来应对与AWS、Google等云巨头的长期消耗战。
Reducto AI的2位创始人也非常有来历,经验和性格的搭配让其顺利走过了从“维生素”到“止痛药” 的硅谷经典创业历程。
Reducto AI由两位MIT毕业的联合创始人Adit Abraham(CEO)和Raunak Chowdhuri(CTO)共同创建。
Adit毕业于麻省理工学院(MIT),获得计算机科学与工程学士学位。他曾在Google担任产品经理,负责YouTube搜索,并领导了YouTube搜索历史上收入最高之一的项目发布。
此外,他还在MIT Media Lab和BlinkAI从事机器学习(ML)研究。Adit是一位具备深厚技术背景的“产品型CEO”,深刻理解技术商业化和规模化的关键。
Raunak同样毕业于MIT,获得计算机科学学士学位,主攻AI与机器人方向。他是一个“技术天才”,在高中毕业前便在计算机视觉(CV)领域发表了学术论文,并获得了超过100次引用。在MIT期间,他还曾在MIT Driverless的感知团队和MIT林肯实验室担任机器学习(ML)研究员。
在创办Reducto之前,Raunak创办了一家计算化学咨询公司,并成功将其干到20万美元的ARR。
图注:Raunak(左)和Adit(右),来源:Business Insider可以说,他是Reducto的技术核心,在计算机视觉领域拥有近十年的“科班”经验。
两位创始人最初相遇在MIT,当时Adit是大三学生,而Raunak是大一新生,他们在一门研究生机器学习课程上结识。
Reducto的诞生并不是一帆风顺,他们也进行了Pivot(产品转型)。
最初,Adit和Raunak申请YC时的项目名为“Remembrall”,它是一个“LLM的长期记忆API”。这个项目在Twitter上引起了一定的关注,并收到了数百个试用注册。
然而,Adit在与这些早期用户交流时发现了问题:虽然用户觉得这个想法“有趣”,但并没有真正的需求,客户只愿意为此支付每月10-20美元。
这个项目显然只是一个“弱信号”的“Vitamin”(维生素)产品,而非真正解决“Painkiller”(止痛药)类问题。
在深入与客户对话后,Adit和Raunak敏锐地意识到,客户反复抱怨的“如果你能管理聊天记录,能否管理用户上传的PDF文件”才是一个“强信号”。
他们发现,几乎所有AI团队都面临“处理PDF的准确性”问题。于是,他们花了一个周末时间,用Streamlit构建了一个简单的PDF解析工具原型,并在YC论坛发布。
结果,得到了截然不同的反馈,用户纷纷表示:“这比我从Textract(AWS)得到的结果还好,有API吗?”
这个反馈让Adit和Raunak意识到,他们找到了真正的“Hair on Fire”的痛点,立即决定放弃原有的LLM记忆项目,转而专注于文档智能,从而诞生了Reducto AI。
在YC期间,他们凭借全新的方向和出色的产品原型,在仍然是“两人创业公司”的时候,就成功签下了一家《财富》10强企业客户,验证了PMF。
而且,Adit的画像在业内非常清晰:极端专注、反直觉、客户至上。他非常重视“拒绝”的艺术(The Art of Saying "No")。在Reducto的早期,他曾果断地“解雇”一个价值5000美元的合同,因为该客户的需求会分散团队的精力。
此外,他也拒绝了价值“数百万美元”的建筑文件合同,因为这不符合他们对核心产品精度的专注。Adit非常推崇“工程师每周只有一个优先事项”的工作模式,确保团队能够在一个方向上做到极致。
作为一位技术背景的创始人,Adit亲自负责公司的销售工作,直到ARR突破500万美元。他的销售理念是“关怀胜于销售技巧”,他强调应该与早期客户建立深度关系,以至于“你愿意邀请他们参加你的婚礼”。
Reducto所处的“智能文档处理”(IDP)市场,正在以20%-30%的高复合年增长率高速扩张。
这个赛道的核心痛点,就是我们开头提到的“80%的数据诅咒”:企业价值被“锁”在非结构化文档中,而传统OCR工具的“准确性灾难”导致AI“垃圾进,垃圾出”。
表面上看,这是一个充斥着三类玩家的“红海”。
云巨头们,像是Amazon Textract, Google Document AI, 它们是云平台的“捆绑”服务,价格低廉,与云生态深度集成。老牌企业软件(像是ABBYY),是为“业务人员”设计的“低代码”RPA工具,品牌历史悠久。同时,这个行业还存在着一堆开源工具(像是Unstructured.io), 免费、可自托管。
然而,Reducto正在这个“红海”中开辟一个全新的“蓝海”。
Reducto AI是一家罕见的,在正确的时间(VLM与RAG爆发的技术周期)由正确的人(“产品CEO” Adit与“技术天才CTO” Raunak)执行了正确战略(从YC的“市场拉力”转型和“极端专注”)的“三重奏”公司。
他们没有去制造“淘金热”中的LLM,而是选择成为那个最关键的“卖铲人”。
云巨头的工具是“大而全”的捆绑产品,但在需要极致准确性的“长尾”复杂文档上表现不佳。Reducto则在基准测试中“最高领先AWS, Google和Azure 20%”。在金融或医疗领域,这20%的准确性几乎就是生与死的区别。
例如,AI原生TPA(第三方管理人)Elysian使用Reducto处理保险索赔文件,将审查速度提高了16倍。医疗公司Anterior使用Reducto处理医疗记录,实现了99%以上的准确率,将决策从几天缩短到几秒。
这种创业路径和领域,也给了许多AI创业者启发。
当然,涌入的创业者,这也给Reducto带来竞争和挑战。袁子恒最近正在陪跑一家中国出海的文档解析创业企业,他表示,这家企业的精度超过了Reducto,并且成本更低,速度更快,还开发了自有的多模态数据解析引擎和多个自研模型,主要面向海外市场,已经获取了很多海外企业客户,有美国的知名大学、金融机构,还有欧洲的一些企业,在解析精度、千页价格、支持的格式种类还超过了欧洲大力扶持的大模型厂商Mistral的OCR。
另一个挑战来自大厂。
首先,AWS和Google正在将其文档处理能力与VLM(如Gemini)和AI平台(如Bedrock)深度“捆绑”销售。他们可能以“更低”甚至“免费”的价格提供“足够好”的解析能力。
其次,行业面临“GPT-5是否会免费解决这一切?”的长期威胁。随着基础模型在视觉理解能力上的飞跃,Reducto的“准确性”优势可能会被削弱。
不过,巨头切入的市场,可能与Reducto不同。袁子恒对文档解析的创业生态十分熟知,DeepSeek也做过类似探索,今年10月发布了Deepseek-OCR,尝试解决大语言模型长文本处理的瓶颈,主要目标是提高 LLM 处理长文档时的计算效率、降低内存占用,并有效解决长上下文的“遗忘机制”问题。本质是输入预处理器,优化了 LLM “看”和“记住”长文档的方式。但袁子恒表示,尽管这种OCR看起来和Reducto很像,但从目标和要解决的问题以及面向的市场来看,和Reducto完全不一样。
还有一个可能的危机,来自CEO Adit Abraham的“极端专注”哲学。“创始人主导销售”、“雇人慢”、“拒绝客户”、“每周一件事”,这些理念帮助他们打造了完美的产品,并实现了从0到500万ARR的奇迹。
但是,这个理念被认为无法将公司从500万ARR带到1亿美元ARR。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4806189.html?f=wyxwapp