
今年春节期间,一颗来自杭州的“AI新星”悄然崛起,它的名字叫 DeepSeek。它就像一道突如其来的闪电,不仅点亮了全球 AI的夜空,更为开源社区带来了一股神秘的“东方力量”。
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。深度求索(DeepSeek)成立于2023年5月,是一家大模型创业公司。成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。2024年5月,该公司发布开源模型DeepSeek-V2,将推理成本降低近百倍,一跃成名。同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。2025年伊始,刚成立两年时间的大模型公司DeepSeek,发布DeepSeek-R1模型。这一模型一经发布,便引起全球人工智能界超级巨震。在数学、代码、推理等方面比肩OpenAI的顶尖模型,且开源权重,降低了AI技术的门槛。这一震惊国内外的创新成果,离不开创始人梁文锋的深度求索。而就在1月20日,中共中央政治局常委、国务院总理李强主持召开专家、企业家和教科文卫体等领域代表座谈会,听取对《政府工作报告(征求意见稿)》的意见建议,来自广东湛江吴川的AI初创公司深度求索(DeepSeek)创始人梁文锋出席并发言,他提出了关于国产大模型发展的独到见解。2月17日,民营企业座谈会在北京召开,习近平总书记出席。在这一群科技“大佬”中,靠着DeepSeek大火出圈的梁文锋又一次端坐其中并发言。他低调却充满力量的形象,成为中国科技力量崛起的缩影。从一位普通的湛江少年,到震撼硅谷的AI创新者,他的故事,是一段关于技术、勇气和坚持的传奇。
这名85后的创业者,以及深度求索(DeepSeek)和幻方量化的创始人梁文锋出生于广东湛江吴川。2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已经积累了市场行情数据和探索全自动量化交易。梁文锋的故事堪称传奇。17岁考入浙江大学,22岁获得硕士学位,25岁带领团队探索量化交易,30岁创立幻方量化并推动AI化转型,38岁投身通用人工智能AGI领域并取得突破性成就。2023年,38岁的梁文锋再次选择站在技术浪潮的最前沿。这一次,他瞄准的是更具前景和挑战的人工智能领域。他创办了深度求索(DeepSeek),这是一家专注于AI大模型研发的公司,目标是用低成本、高性能的技术,打破国际巨头在人工智能领域的垄断。梁文锋对人工智能并不陌生。在幻方量化的崛起过程中,人工智能早已成为量化策略的核心驱动力。而这次,他决定跳出金融行业,把自己对技术的热情倾注到人工智能的大模型研发中。他的思路十分明确——通过技术创新和成本优化,让AI技术更加普惠。他直言:“我们不是要跟随,而是要在技术上真正超越。”他的每一步,都精准地踩在了时代的节拍上。比如,2016年幻方量化推出第一个AI模型,实现了量化策略的AI化转型。当时,AI在金融领域的应用还处于萌芽阶段,但梁文锋凭借敏锐的洞察力,率先布局,最终让幻方量化成为行业的标杆。
梁文锋不仅是量化投资领域的“王者”,更是人工智能领域的先锋。他领导的团队仅用2048张GPU,在53天内打造出全球领先的大模型“DeepSeek-V3”,用极低成本完成了对美国OpenAI的技术“逆袭”。
2024年是DeepSeek的爆发之年。在成立仅一年后,DeepSeek就凭借其创新能力,成为AI领域一颗耀眼的新星。2024年5月,DeepSeek发布了其首款混合专家语言模型DeepSeek-V2。这一模型以超低的价格震惊市场:每百万tokens输入1元、输出2元,仅为GPT-4 Turbo价格的百分之一。凭借出色的性能和性价比,DeepSeek-V2引发了一场大模型价格战,国内外科技巨头纷纷跟进降价。然而,DeepSeek的真正爆发点出现在2024年12月。梁文锋带领团队推出了新一代大模型DeepSeek-V3。这款模型不仅在数学运算、代码生成和中文问答等方面表现出色,更令人震惊的是,它的训练成本仅为557.6万美元,而OpenAI的GPT-4o训练成本高达7800万美元。DeepSeek-V3以1/10的成本实现了对GPT-4o的全面对标,被美国科技圈称为“来自东方的神秘力量”。DeepSeek的成功并非偶然,而是梁文锋在团队管理和技术研发上的一系列独特策略的结果。他组建了一支完全由本土年轻程序员组成的团队,不依赖海归或高级技术专家。团队成员大多是应届毕业生或工作经验不超过5年的年轻人。梁文锋认为,“创新需要摆脱惯性,经验有时会成为包袱。”此外,DeepSeek采取了开源的技术策略,主动向全球开发者社区分享核心技术成果。这种开放的态度不仅赢得了国际认可,也推动了行业技术生态的快速发展。OpenAI的创始成员安德烈·卡帕西(Andrej Karpathy)评价说:“DeepSeek在有限资源下展现了惊人的工程能力,它可能重新定义大模型研发的规则。”DeepSeek的技术突破让美国硅谷震撼不已,多位业内人士称,DeepSeek-V3的问世打破了全球AI巨头的“成本壁垒”。有评论认为,DeepSeek在降低算力需求、优化训练效率上的创新,可能会彻底改变AI行业的生态。然而,梁文锋并未急于将DeepSeek商业化。他坚信,人工智能领域的成功取决于长期的技术积累,而非短期的盈利目标。他表示,DeepSeek的使命是“以更低的成本、更高效的技术推动人工智能的普及”,并始终把技术研发置于首位。从量化投资到人工智能,梁文锋不断用实践证明,中国科技不仅能参与全球竞争,更能引领技术变革。他认为,中国科技企业不能永远跟随,而是要勇敢站到前沿。深度求索的成功,证明了他的远见和坚持。
在全球AI竞争愈发激烈的今天,梁文锋用技术和创新,让中国AI力量在国际舞台上赢得了一席之地。正如他所说:“我们不只是追赶,更要在核心技术上实现真正的超越。”梁文锋,这位85后中国小伙,正用他的低调和实力,为中国科技书写更多震撼全球的故事。