从循环模型 Ouro 到 NVIDIA Rubin:推理时代的殊途同归
过去几年,AI 变强的故事讲得很简单:砸更多训练算力、喂更多数据、把模型做得更大。可以把它理解为多读书、多刷题,靠训练阶段把能力压进参数里。可最近一段时间,风向可能有所变化:同样一个模型,不一定要继续变大,只要在遇到难题时多想一会儿,结果就能明显变好。 ...
过去几年,AI 变强的故事讲得很简单:砸更多训练算力、喂更多数据、把模型做得更大。可以把它理解为多读书、多刷题,靠训练阶段把能力压进参数里。可最近一段时间,风向可能有所变化:同样一个模型,不一定要继续变大,只要在遇到难题时多想一会儿,结果就能明显变好。 ...