2月28日,GPT4.5默默地上线了,为什么说是默默呢?因为媒体几乎没啥报道。它的被讨论热度甚至还不如当天DeepSeek公布的开源项目3FS。
一、性能提升有限,未形成明显优势
尽管GPT4.5号称是算力和数据规模最大的模型,但其性能优势并不明显。虽然事实性问答最强,幻觉明显下降,但在软件开发等领域提升仍不如 Claude 3.7。
GPT4.5不是一个前沿模型,不是一个推理模型。 GPT4.5深度推理很差,还不如 Claude 3.7 、DeepSeek R1 和 OpenAI o3-mini
二、高昂的成本
每百万tokens输入要75美元,每百万tokens输出要150万美元。这一价格比GPT 4O贵了20倍,提升曲线已经完全没有性价比。而另一边的DeepSeek-R1 才16元/百万Token,凌晨的闲时甚至低至4元。
算个账,如果每个汉字算1个token,问了GPT4.5一个问题550字,得到5500字的回复,这几十块就没了。如果多次交互后,成本更是惊人。这种高昂的成本注定会吓退大多数中小开发者们,迫使他们转向DeepSeek等替代方案。
三、技术路线的局限性
GPT4.5依然力来大量 GPU 进行训练,而DeepSeek则通过优化算法减少对GPU的力来。GPT4.5的“力大砖飞”路线已经接近极限,现在OpenAI甚至也GPU不够用而分批上线GPT-4.5了。
DeepSeek R1的贡献在于将重心从算力向算法优化,降低了训练和部署大模型对硬件的需求。这种趋势将对OpenAI和Grok等依赖高算力的商业模式构成挑战。
随便提一下,在Deepseek的开源周活动中,原本计划每天分批公布代码,但周六却意外放出了重磅内容——直接开源了关乎模型公司核心运营的推理系统概览。简而言之,这是一个分布式智能的精准编排系统,通过跨节点专家并行、通讯与计算重叠以及多层次负载均衡,将计算资源高效协同地整合为分布式系统。
更令人惊讶的是,Deepseek还宣布以低价提供服务,同时成本利润率高达545%,这一数字令人瞩目。相比之下,那些依赖雄厚云计算资源、以高成本堆砌算力的模式显得效率低下且不可持续。显然,Deepseek的路径更具前瞻性和竞争力。
如果DeepSeek V4(目前是V3)超过GPT-4.5,那全球科技股的估值体系都将重塑。DeepSeek的开源、低价和高性能优势,使其在AI领域的竞争力不断增强。
最后,GPT-4.5的发布虽有性能提升,但其高昂的成本和有限的性能提升使其难以在市场中占据主导地位。相比之下,DeepSeek通过算法优化、低成本策略和开源的模式,正在逐步改变AI领域的竞争格局。未来,随着算法优化的进一步深入,依赖高算力的商业模式将面临更大的挑战。
(转自:包子君)
MACD金叉信号形成,这些股涨势不错!