今日快讯 发表于 2025-3-6 06:55:12

阿里推出全新推理模型,仅1/21参数媲美DeepSeek R1



【阿里推出全新推理模型,仅1/21参数媲美DeepSeek R1】桃报道,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型,QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
查看原文(可能需要外网)
页: [1]
查看完整版本: 阿里推出全新推理模型,仅1/21参数媲美DeepSeek R1