列车相撞已致14死
姚顺雨的88天_蜘蛛资讯网

年1月26日,腾讯年会现场,腾讯总裁刘炽平在台上做了一件高管很少做的事,公开复盘混元大模型为什么不行。 他用了一个比喻:高中生背题应考。成绩单好看,但真正上了考场就露馅。盘点之后发现,每个关键模块都有缺失。 马化腾的措辞更直接:太慢了。慢了9个月到1年。 从那场年会到今天 Hy3 preview上线,88天。 背题拿不了真分 腾讯混元的故事要从2023年9月说起,腾讯在全球数字生态
是缺人。问题出在路径上。 刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限,团队选了捷径,用SFT(监督微调)去打榜。效果立竿见影,成绩单漂亮,但一进真实业务场景就暴露,泛化能力差,模型能力无法复用到产品上。 再往下挖,每一层都有裂缝。数据做得不够多,预训练不稳定,AI Infra无法规模化,强化学习缺因子和目标,底座模型撑不起上层应用。 这直接导致了产品端的困局。元宝,腾讯的AI助手
当前文章:http://3w1cd.guandianke.cn/8a5pm8/7ktkea.html
发布时间:11:17:59