DeepSeek更新优化编程能力 多方面能力提升显著!DeepSeek昨晚在官方群宣布,其线上版本模型已升级至DeepSeek V3.1。新版本的上下文窗口从原有的64k扩展至128k,用户可以通过网页、App和小程序体验这一模型。
DeepSeek还将App和网页端的“深度思考(R1)”字样改为了“深度思考”。有网友猜测这是融合推理模型与非推理模型的征兆,但官方尚未对此做出回应。
目前,DeepSeek V3.1的基础模型已上传至Hugging Face平台,配置文件、脚本代码和模型权重均可供下载。与之前的DeepSeek-V3-0324相比,新模型的参数量和张量类型没有明显变化。
智东西对新模型进行了初步体验,发现其在编程、物理定律理解、创意写作、数学以及回答语气等方面都有不同程度的提升。例如,在个人网站开发方面,DeepSeek-V3.1生成的代码长度增加,开发耗时更长,但最终交付的结果在完成度和美观性上有所提高。新模型打造的网页布局更为合理,重点清晰,还配有图片。
在小游戏开发方面,DeepSeek-V3.1复现了Chrome浏览器断网时的小恐龙游戏,约两分钟内完成了开发。虽然游戏画风和规则与原版相似,但小恐龙外观并未准确还原,游戏障碍生成和跳跃方式也导致可玩性较差。
对于小众历史问题的回答,DeepSeek-V3.1表现出了更高的信息量和准确性。当被问及布须曼人是否喝牛奶时,新模型提供了更多细节,并且这些新增的信息经过事实核查后基本属实。此外,新模型的回答语气更为活泼温暖,语言更通俗口语化,解释更加丰满和有故事性。
在评价马斯克和阿尔特曼谁更牛的问题上,DeepSeek-V3.1认为马斯克更牛,但也给阿尔特曼不少赞美,未遵循用户限定只输出一个名字的指令,而是对两位AI大佬都进行了夸赞。
在诗歌创作方面,DeepSeek-V3.1写了一首诗致敬DeepSeek-V3,风格依旧充满各种比喻和类比。而在基础算术题上,新模型最终给出了正确答案,但过程有些曲折。
一些网友已经使用了新模型并分享了他们的体验。AI博主Zephyr反映,新模型打造的小球跳动效果更加符合物理定律,还有重力、摩擦、旋转速度和弹跳等可调整的参数。另一位网友则让DeepSeek-V3.1为自己绘制了一幅自画像。
体验完模型能力后,网友们期待DeepSeek能在Hugging Face主页上开源更多不同版本的DeepSeek-V3.1。