第八周,2.16-2.22。本周是春节,所以有一半时间是在玩,期间初一到初三基本上都是在玩Openclaw,最后也不是搞得很明白其核心作用在哪,结果就是用成了一个脚本触发工具,定期触发写死的脚本,但是这没有openclaw也能干,而且模型回答出奇的慢,不知道是telegram/openrouter/DeepSeek哪个的问题。Openclaw本身bug也不少,目前感觉更像是个玩具吧。 剩下的实践部分也是算是大部分完成了07-第七周的目标:

  • 完成测试,尝试复现96%成功率
  • 完成训练,熟悉wandb以及依赖等工程问题
  • 思考好微调部分的task,最好找到有论文可以参考复现

至于微调部分,可能还是调调参,涉及炼丹就不用这么复杂的模型了,用简单的SmolVLA训练就行了吧。这周的主要内容都在PI05 CKPT训练,写的也是挺长的。

至于下周,主要目标是

可选支线:

  • 尝试配置RFT的环境
  • 用SmolVLA尝试调参

寒假结束就7天了,Sad