来自中国的“神秘力量” 火爆全球 DeepSeek引领科技新潮流

百家号 2025-01-27 17:24:07

A+ A-

由国产大模型公司杭州深度求索开发的Deepseek应用在27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，在美区下载榜上超越了ChatGPT，受到广泛关注。Deepseek被认为是大模型行业的最大“黑马”，在外网被不少人称为“神秘的东方力量”。

来自中国的“神秘力量” 火爆全球

DeepSeek成立于2023年7月17日，专注于开发先进的大语言模型（LLM）及相关技术。2024年12月，DeepSeek发布了V3版本。AI数据服务公司Scale AI创始人Alexander Wang发帖称，DeepSeek-V3是中国科技界带给美国的苦涩教训，指出当美国休息时，中国科技界以更低的成本、更快的速度和更强的实力追赶上来。

来自中国的“神秘力量” 火爆全球 DeepSeek引领科技新潮流

今年1月20日，DeepSeek正式开源R1推理模型，其“物美价廉”的特性在海外开发者社区中引发轰动。目前，在国外大模型排名榜Chatbot Arena上，DeepSeek-R1的基准测试排名已升至全类别大模型第三，与OpenAI的ChatGPT-4最新版并列，并在风格控制类模型分类中与OpenAI的o1模型并列第一。

来自中国的“神秘力量” 火爆全球 DeepSeek引领科技新潮流

DeepSeek备受关注的原因在于性价比高、开源以及推理能力的提升。DeepSeek R1成本很低，预训练费用仅为557.6万美元，不到OpenAI GPT-4模型训练成本的十分之一。API定价大约是OpenAI o1运行成本的三十分之一。DeepSeek采用开源模式，公布了相关论文，整个过程可复现。加州大学伯克利分校、香港科技大学、知名人工智能公司HuggingFace等纷纷成功复现，复现成本甚至低至几十美元。

来自中国的“神秘力量” 火爆全球 DeepSeek引领科技新潮流

中国DeepSeek的模型是开源的，将制造这些模型的知识免费提供给全世界，确保没有人能够真正垄断它。相比之下，美国公司如OpenAI、Anthropic或谷歌并未开源任何强大的模型。英伟达高级研究科学家Jim Fan表示，我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理，但最有趣的结局往往最可能成真。

在推理能力方面，据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。这种卓越的性能不仅吸引了科技界的广泛关注，也让投资界看到了其巨大的商业潜力。

DeepSeek团队不到140人，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。《黑神话：悟空》制作人冯骥评价DeepSeek：这可能是个国运级别的科技成果。

责任编辑：张小花 TT1000

来自中国的“神秘力量” 火爆全球 DeepSeek引领科技新潮流

热点新闻

精彩推荐