快科技3月28日消息,日前,DeepSeek宣布DeepSeek V3模型完成小版本升级,版本号为DeepSeek-V3-0324。
27日晚,摩尔线程宣布,其迅速响应并完成了对DeepSeek-V3的无缝升级,实现了零报错、零兼容性问题的光速部署。
摩尔线程表示,在Deepseek-V3-0324模型上的光速适配,再次有力验证了国产全功能GPU在推动大模型产业化落地方面的巨大潜力。
据了解,DeepSeek-V3-0324模型参数从初代V3的6710亿小幅增至6850亿,依然采用混合专家(MoE)架构,每个token激活约370亿参数,在推理、编程、数学、中文处理等多个领域达到行业领先水平。
根据DeepSeek官方发布的测试报告,DeepSeek-V3-0324在各项能力评测中表现出色。
DeepSeek-V3-0324不仅全面超越Claude-3.7-Sonnet与Qwen-Max等同类型优质模型,更在数学、代码类等相关评测集上胜过了GPT-4.5。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:拾柒
0 条