DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K

时间:2025-08-20 10:12:02来源:互联网

下面小编就为大家分享一篇DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K,具有很好的参考价值,希望对大家有所帮助。

alixixi 8 月 20 日消息,DeepSeek 昨天深夜在 Hugging Face 上开源了新模型 V3.1-Base,根据介绍,该模型将上下文长度拓展至 128K,参数约为 685B。

alixixi附开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

而在昨晚早些时候,DeepSeek 发布通知称,线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。

需要注意的是,大家期待已久的 DeepSeek R2 仍没有确定的发布时间。

本站部分内容转载自互联网,如果有网站内容侵犯了您的权益,可直接联系我们删除,感谢支持!