梁文锋:俯身做真正的创新

(视觉中国/图)

2024到2025年,科技行业让人无法忽视的一个现象是DeepSeek,以及它背后的创始人梁文锋。

梁文锋的公开资料很少,他在公共场合露面也不多。他是一个戴眼镜的、看上去很极客的年轻人。在媒体报道中,行业人士评价他“既可以从高处做精准判断,又可以在细节上强过一线研究员”。

梁文锋说,自己在广东五线城市长大,父亲是小学老师。1990年代,“广东赚钱机会很多,当时有不少家长到我家里来,(说的)基本就是家长觉得读书没用。”他本硕均就读于浙江大学,硕论题目为《基于低成本PTZ摄像机的目标跟踪算法研究》。

2015年成立、致力于通过数学和人工智能进行量化投资的幻方科技的技术基因,无疑给了梁文锋对技术驱动型创新的底气。但他也说,他们经历了漫长的积累过程,“外部看到的是幻方2015年后的部分,但其实我们做了16年。”

根据公开资料,梁文锋带领团队从2008年起就在探索全自动量化交易。2016年,幻方量化推出了第一个AI模型。2020年,幻方的AI超级计算机“萤火一号”投入运作。一年后,投入10亿元的“萤火二号”开始建设。2023年7月,大模型公司DeepSeek成立,梁文锋进军人工智能领域。

OpenAI前政策主管、Anthropic联合创始人杰克·克拉克(Jack Clark)认为DeepSeek雇佣了“高深莫测的奇才”,而梁文锋的回应是,做出DeepSeek-V2模型的没有海外回来的人,都是本土的:有毕业几年的年轻人,也有顶尖高校的应届生和博士实习生。

对于DeepSeek来说,几个重要的时间点是:2024年5月,DeepSeek-V2发布;同年12月27日,DeepSeek-V3发布;2025年1月20日,DeepSeek-R1模型发布。

第三个时间点对于大众而言感触甚深。正好在2025年春节前后,DeepSeek引起了普通人与AI对话的风潮。一只蓝色的海豚,“我可以帮你写代码、读文件、写作各种创意内容,请把你的任务交给我吧~”这句话,几乎在一夜之间深入人心。

随之而来的是,因为访客量过大,DeepSeek网站拥堵,网友纷纷讨论在什么时间与DeepSeek对话会比较通畅。

有媒体把《哪吒2》在春节档票房刷新国内影史纪录与DeepSeek在大众层面的走红相提并论,把它们归为文娱和科技领域开年的“惊人的流量密码”。尽管从ChatGPT开始,国内外已经出现多款产品,但低调的DeepSeek在国内获得了意外的知名度。

关注科技行业的人士更津津乐道的是DeepSeek对模型架构的创新。DeepSeek-V2开源模型“史无前例的性价比”,使得“推理成本被降到每百万token仅1块钱,约等于Llama370B的七分之一,GPT-4Turbo的七十分之一”。DeepSeek被一些人形容为行业的一条鲶鱼,一举引爆了国内外所有大厂的大模型价格战。梁文锋则表示,“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”“我们的原则是不贴钱,也不赚取暴利。”

将近一年前,曾有记者问及将主要精力放在哪里,梁文锋说,他的精力主要在研究下一代大模型。“所有的套路都是上一代的产物,未来不一定成立。拿互联网的商业逻辑去讨论未来AI的盈利模式,就像马化腾创业时,你去讨论通用电气和可口可乐一样。很可能是一种刻舟求剑。”

他在采访中强调创新的重要性。记者问道,经济下行、资本进入冷周期,对原创式创新是否起抑制作用?梁文锋的回答是,未必。“中国产业结构的调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。”他说。

•推荐理由

毫无疑问的是,在过去一年,梁文锋和他创始成立的DeepSeek改变了国内对话式AI应用的格局。不是应用变现,而是技术创新,梁文锋的故事,就是不断创新、不断破界的故事。

南方人物周刊记者 张宇欣

责编 李屾淼

友情提示

本站部分转载文章,皆来自互联网,仅供参考及分享,并不用于任何商业用途;版权归原作者所有,如涉及作品内容、版权和其他问题,请与本网联系,我们将在第一时间删除内容!

联系邮箱:1042463605@qq.com