你的位置:bob数码科技 > 新闻动态 > 令美国的头疼的DeepSeek,创始人说漏嘴,背后团队果然不简单!
令美国的头疼的DeepSeek,创始人说漏嘴,背后团队果然不简单!
发布日期:2025-02-05 09:03    点击次数:107

近日,DeepSeekR1在网络上引起了广泛关注,其低成本和高效率让美国的所有Ai公司都感到震惊。

今日,我们不再深入探讨DeepSeekR1的卓越之处,而是专注于这个大型模型背后的那群人,探讨他们为何如此出奇制胜?

大家都知道,DeepSeek的创始人是梁文锋,他出生在80年代,毕业自浙江大学的信息与电子工程学专业,并专攻电子工程系的人工智能方向。在浙江大学攻读硕士研究生的时候,他发表了一篇高质量的论文,题为《基于低成本PTZ摄像机的目标跟踪算法研究》,可以说他是一个技术高手。

DeepSeek最初是以幻方量化的形式出现的,其影响力也同样令人印象深刻。

在2015年,梁文锋与他的校友联手创建了幻方量化公司。令人惊讶的是,仅仅用了5年的时间,这家企业已经发展成为国内规模高达千亿的量化私营大厂。他们还成功地建立了“萤火一号”集群,并构建了一个超大规模的算力底座,为DeepSeek打下了坚实的基础。

DeepSeek的发展速度令人震惊

DeepSeek公司于2023年7月17日正式成立,其核心业务是研发先进的大语言模型。尽管直到现在只过去了不到一年的时间,但其研发进度仍然令人震惊。

2023年11月2日,DeepSeek推出了其首款DeepSeek Coder模型。

在2024年的5月,DeepSeek V2被正式公布。

2024年12月26日,DeepSeek V3被正式公布。

到了2025年1月20日,DeepSeek R1的发布目标明确指向了美国最顶尖的AI模型——OpenAI o1。

从DeepSeek的发布频次和时间线来看,它在2024年展现出了惊人的创新能力。这一次,令美国感到困惑的是DeepSeek R1,它轻而易举地超越了美国目前所有的顶尖AI模型,给他们带来了意想不到的打击。

显然,除了感到震惊,他们对DeepSeek背后的团队表现出更高的兴趣。

当时,许多国外媒体都在推测DeepSeek作为一家新兴企业,有可能以令人震惊的速度在Ai领域达到顶峰。这个团队的核心成员很可能是来自全球Ai领域前50名的顶尖研究人员。

尽管如此,梁文锋在与媒体的交谈中表示:“我们的团队成员全部来自国内,包括一些顶尖大学的即将毕业的学生、尚未毕业的博四和博五的实习生,以及那些刚刚毕业不久的年轻人。”

梁文锋特别指出,尽管很多人觉得我们公司的核心团队成员都是来自该行业的前50名顶级人才,但实际上并没有这样的人才,他们也不太可能来到中国,但我们完全有能力培养这样的专业人才。

PS:以前总有观点认为,中国的大学生过于重视理论知识,而忽视了实际成果的应用。但现在的观点似乎有些片面。企业与学校的合作不仅可以发掘有才华的人才,还能将这些理论知识应用到实际工作中,并根据企业的实际需求进行创新。实际上,这种合作效率是相当高的,当然,这背后需要像梁文锋这样的领军人物。

除此之外,梁文锋出乎意料地泄露了团队中的一个关键成员身份,他提到:“不久前,传雷军用千万年薪挖掘出的“95Ai天才少女”罗福莉就在DeepSeek。”

根据现有的资料,罗福莉是四川出生的,她在北京师范大学的计算机专业学习。在大学三年级时,她加入了北大语言计算机实验室进行实习,并选择了NLP作为她的研究领域。后来,她进入北大计算机语言学研究所,专注于Ai语言大模型的研究工作。

在2019年,他在国际顶尖的ACL会议上公开了8篇关于人工智能的研究论文。随后,他在阿里达摩院进行了人工智能语言模型的培训。到了2022年,他加入了DeepSeek的团队,并参与了MoE大模型以及DeepSeek-V2的研究工作。

关于小米提供的高薪邀请,罗福莉并没有进行否认或确认,但她的高中班主任表示,她还未深思熟虑,这并不是毫无根据的说法。

在1月27日,当记者再一次进行询问时,那位班主任确认罗福莉确实参与了DeepSeek的开发工作。

据了解,DeepSeek的研发团队由139名成员组成,但在算子、推理框架和多模型等关键领域的研发人员仅约70人。与Open AI的1200名研发人员相比,DeepSeek的研发实力几乎是1抵9,这足以证明其在创新方面的实力!



相关资讯