您现在的位置是:首页 >行业资讯 > 科技信息 > 2025-01-17 03:25:04 来源:
阿里云通义团队发布Qwen2.5-Math-PRM数学推理模型,7B版本力压GPT-4o
导读 阿里云通义团队推出了全新的数学推理过程奖励模型Qwen2.5-Math-PRM,提供72B和7B两种版本,性能卓越,尤其在识别推理错误方面表现突出。其...
阿里云通义团队推出了全新的数学推理过程奖励模型Qwen2.5-Math-PRM,提供72B和7B两种版本,性能卓越,尤其在识别推理错误方面表现突出。其中,7B版本成功超越GPT-4o,标志着阿里云在推理模型研发上的重要突破。
为全面评估模型表现,团队还开源了首个步骤级的评估标准ProcessBench,涵盖3400个数学问题,包括国际奥林匹克数学竞赛难度的题目。评估显示,Qwen2.5-Math-PRM的两个版本均表现出色,特别是7B版本,展现了过程奖励模型在提高推理可靠性方面的巨大潜力,为行业提供了新思路。
猜你喜欢
最新文章
点击排行
- 阿里云通义团队发布Qwen2.5-Math-PRM数学推理模型,7B版本力压GPT-4o
- 25.99万元起售!全新宝马2系四门轿跑震撼登场
- 抄底抢购!得力24色双头马克笔/水彩笔特惠发车:仅需9元轻松入手!
- 币界网晚讯速递:CRV币价跌至0.9401美元,日内波动下滑3.01%
- 币界网晚间快讯:SOL索拉纳价格飙升破$210大关,24小时涨幅高达12.625%
- 全新宝马2系四门轿跑震撼登场!优雅与运动并重
- 国家烟草专卖局原局长凌成兴涉嫌受贿4311万余元案受审
- 149元超值抢购!京鲜生年货礼盒大促来袭:精选1斤红颜草莓+5斤2J级车厘子+4盒蓝莓
- 成品油价格即将显著攀升
- 美国颁布新规封杀中国智能网联汽车,中汽协强烈反对并呼吁合作