horace - 搜索 News

腾讯网13 小时

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

1. 开源微调神器Unsloth优化了DeepSeek-R1同款GRPO训练算法，上下文变长10倍，显存需求减少90%。 3.

一些您可能无法访问的结果已被隐去。

显示无法访问的结果