DeepSeek天才少女!DeepSeek的招聘信息登上热搜第一,引发了广泛关注。招聘信息显示,最高薪资达到110k×14,本科应届生也能获得90k×14的年薪。实习生的日薪从500元起,最高可达1000元,按每月20天计算,月收入可过万元。这令许多网友羡慕不已,有人感慨AI行业就像当初的互联网,又将有一批人享受到时代红利。
不过,在发稿前,BOSS平台上的DeepSeek招聘职位已清空,具体原因尚不清楚。从已公布的招聘信息来看,DeepSeek对学历和专业背景要求宽松,多数岗位面向本科生开放。无论是核心系统的研发工程师还是其他岗位,都欢迎应届毕业生和无工作经验者申请。
DeepSeek团队非常年轻,许多成员是来自顶尖高校的应届毕业生或在读博士。这些年轻人在公司内发挥了重要作用,提出了诸如多头潜在注意力机制(MLA)和GRPO强化学习对齐算法等关键创新。例如,一篇被ICLR 2025接收的论文的第一作者就是一名大四实习生,该论文在数学证明模型方面取得了显著成果。
DeepSeek创始人梁文锋表示,公司在招聘时更看重能力而非经验。他认为,如果追求长远目标,基础能力、创造力和热爱更为重要。尽管招聘条件看似宽松,但实际要求非常高,需要应聘者对各类AI模型有深入了解,并掌握相关编程语言,有些岗位还要求发表过顶刊或在知名竞赛中获奖。
DeepSeek内部管理风格较为自由,员工入职后会被赋予重要任务,但不设KPI,鼓励自主发挥。同时,公司提供充足的计算资源,员工可以随时调用训练集群而无需审批。这种管理模式激发了员工的创新潜力,使得DeepSeek能够与OpenAI等巨头竞争。
DeepSeek的目标是专注于研究和探索,而不是开发垂直应用。虽然这种选择可能面临更多挑战,但公司认为推动技术创新比依靠拿来主义赚快钱更有意义。年轻人作为最具信心和活力的群体,在这种环境中更容易取得突破。
DeepSeek在算力资源上的投入也非常大。据报告推测,公司拥有约5万块Hopper GPU,投资超过5亿美元。这些GPU将在幻方量化和DeepSeek之间共享。此外,公司的硬件支出远超5亿美元,用于开发新架构的研究也耗费了大量资金和算力。尽管如此,DeepSeek通过优化技术如MLA机制,大幅降低了每次查询所需的KV缓存,提升了性价比。
最近几天,腾讯云、阿里云、百度智能云等各大云计算平台纷纷上架DeepSeek模型,显示出市场对其高度关注。在这种背景下,DeepSeek开出高薪招揽人才也就不足为奇了。