火遍全球的DeepSeek：科学家是怎么用它的？创新技术引领未来方向

华商网 2025-02-05 23:19:26

A+ A-

火遍全球的DeepSeek科学家是怎么用它的。过年期间爆火的DeepSeek是一家专注于开发先进大语言模型和相关技术的创新型科技公司，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日。在硅谷，DeepSeek被称作“来自东方的神秘力量”。2024年底，DeepSeek发布了新一代大语言模型V3，随后在2025年1月20日推出了开源模型R1，再次引发全球关注。R1模型通过纯深度学习的方法让AI自发涌现出推理能力，发布后在全球范围内掀起热潮，在中国区和美国区苹果AppStore免费榜均位列首位，超越了包括ChatGPT在内的多个知名AI产品。

阿里云、百度智能云、华为云、腾讯云等国内四大云巨头以及海外的亚马逊AWS、微软Azure等云巨头都已正式支持DeepSeek。春节期间，多家国产芯片厂商也积极响应，如天数智芯、摩尔线程等宣布支持DeepSeek模型。GiteeAI联合沐曦还首发了全套DeepSeek-R1千问蒸馏模型，实现了从芯片到平台，从算力到模型的全国产研发、中国制造。

DeepSeek不仅在技术上表现出色，在市场上也取得了巨大成功。这款由中国的深度求索公司研发的大型语言模型拥有强大的自然语言处理能力，能够理解并回答问题，还能辅助写代码、整理资料和解决复杂的数学问题。与OpenAI开发的Chat-GPT相比，DeepSeek以更低的成本达到了相似甚至更好的效果，引发了广泛讨论。DeepSeek代表了AI的未来方向——更懂人话，更会思考，并且擅长个性化发挥，被称为“全能型AI助手”。

随着DeepSeek掀起新一轮AI热潮，业内人士认为它将推动AI实现“平民化”。正如苹果iPhone改变了人们的生活方式，DeepSeek将通过开源系统让更多开发者开发出有用的AI应用场景，使AI走入普通人的生活。AI开源初创公司HuggingFace联合创始人Thomas Wolf表示，下一步将是建立在这些模型之上的应用，让模型在应用层面变得有用，从而完成现实中的任务，让人们在生活中受益。

然而，DeepSeek的成功也引起了某些势力的注意。1月30日凌晨，针对DeepSeek线上服务的攻击烈度突然升级，至少有2个僵尸网络参与了攻击。中国常驻联合国代表傅聪对此表示：“永远不要低估中国科研人员的聪明才智。DeepSeek引发全球轰动和一些人的焦虑恐慌，说明技术遏制和技术限制无法奏效。”

DeepSeek之所以让美国感到紧张，主要因为它具有高性价比、模式创新和显著的进步。DeepSeek的出现打破了美国大模型的垄断地位，降低了行业门槛，并通过创新的数据处理方法优化了算力，提升了模型性能。这不仅冲击了美国的技术优势，也引发了美国高新技术人员的担忧。根据报告，2024年国内大模型的能力进步显著，国内外差距大幅缩小。这表明DeepSeek的成功是中国国内大模型整体发展的阶段性成果。

责任编辑：卢其龙 CN070

火遍全球的DeepSeek：科学家是怎么用它的？创新技术引领未来方向

热点新闻

精彩推荐