发布日期:2025-02-21 23:03 点击次数:127
月之暗面研究员 Flood Sung 近日分享了 k1.5 模型背后的完整思考过程港股开户配资,并透露称,2024 年 9 月 12 号 OpenAI o1 发布带来的震撼效果,令自己陷入了 Long-CoT 的有效性反思中。因为 Long-CoT 的有效性,其实在一年多前月之暗面 Kimi 联合创始人 Tim 周昕宇就验证过港股开户配资,使用很小的模型,训练模型做几十位的加减乘除运算,将细粒度的运算过程合成出来变成很长的 CoT 数据做 SFT,就可以获得非常好的效果。Flood Sung 表示,公司意识到 Long Context 的重要性,所以率先考虑把 Context 搞长,但却对 Long-CoT 这件事情不够重视,其实主要还是考虑了成本问题。(新浪科技)
Powered by 炒股配资公司平台网站_最大炒股配资平台_专业的正规实盘配资网站 @2013-2022 RSS地图 HTML地图