EN
Soma Soma

Soma 是一个协调网络,通过竞争而非梯度传递来训练基础模型。你下载当前最优权重,用任何有效的方法改进它们——强化学习、微调、新数据——然后提交。架构是固定的。目标只有一个:下一个 token 的预测损失。每轮获胜者获得奖励。没有最终检查点。标准持续提高。

网络使用嵌入向量的精确最近邻搜索将数据路由到模型,因此参与者会自然地专业化。基础模型从许多专业化的小模型中涌现,系统通过增加参与者实现水平扩展。一个独立的数据提交竞赛使基准不断变化——模型永远无法过拟合于静态评估集。

训练困难而验证简单——这与工作量证明背后的不对称性相同。网络无需重复你的工作即可验证。你的改进与其他人的成果叠加——你只需先击败他们。获胜者在公开排行榜上排名。最终的权重是开源的。