08-第八周设定的任务:

可选支线:

  • 尝试配置RFT的环境
  • 用SmolVLA尝试调参

可以说基本没有完成,只把Diffusion & Flow model推进了一点。不过考虑到要开学了,也能接受吧,基本是开学前都在玩了。

但是这周主要在思考一件事:应该以什么标准,或者说阶段性目标来要求自己,应该追求什么目标?是追求本科生就业,还是研究生、博士生才去就业?应该培养什么方面的能力,着重什么方向,是注重开源,还是顶会,以及对代码能力的要求如何?

或许行业招聘的标准来要求自己是一个好的选择,但是之前一直找不到一个好的岗位标准,在招聘网站上搜「大模型」、「AI」搜出来的岗位也是鱼龙混杂。这周也是斗胆在字节的招聘网站上将「Seed」作为搜索关键词,作为顶尖AI lab,这个要求肯定是过高的,但是我认为还是有参考价值。

以下摘取了几个字节招聘网站中几个大模型相关的职位的要求:

大语言模型算法工程师-Seed
1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 
2、熟悉NLP、CV相关的算法和技术,熟悉大模型训练、RL算法者优先; 
3、在大模型领域,主导过大影响力的项目或论文者优先; 
4、出色的问题分析和解决能力,能深入解决大模型训练和应用存在的问题;
5、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
机器人研究员-Seed
1、计算机、自动化、数学、电子等相关专业的硕士研究生及以上学历; 
2、有以下领域之一的研究积累(作为主要作者发表过CVPR,ICRA,IROS,RSS,NeurIPS等论文):多模态融合、机器人操作与抓取、2D/3D视觉感知、SLAM、人机交互、机器人导航; 
3、具备独立开展研究工作的能力; 
4、拥有智能机器人开发、ROS以及参加过机器人相关比赛的同学优先; 
5、算法和编程能力强,ACM ICPC,NOI/IOI,Top Coder,Kaggle比赛获奖者优先。
机器人Linux驱动开发专家-Seed
1、本科以上学历,计算机、电子或自动化等相关专业,3年以上BSP开发经验; 
2、熟悉Arm/X86/Risc-V等架构,熟悉C语言,有扎实的编程功底,具备硬件分析能力,Datasheet阅读能力; 
3、具备以下驱动模块的开发经验(包括但不限于):Camera、MIPI、Sensor、WIFI/4G/BT、Security、Power、Stability、USB、PCIe、GPIO/SPI/I2C/UART,SSD/EMMC; 
4、熟练使用Kprobe,Ftrace,Perf,Top,Bcc,EBPF等工具对内核、应用做性能分析,快速定位系统性能问题; 
5、对从事底层驱动软件开发有浓厚的兴趣及技术钻研能力,良好的团队精神和沟通能力。
豆包大模型多模态算法工程师-Seed
1、具有优秀的基础算法、代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 
2、具有扎实的计算机视觉、机器学习基础,熟悉CV、AIGC、NLP、RL等技术领域,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议上发表论文者优先; 
3、在大模型领域或者RL领域,主导过项目者优先; 
4、具有出色的分析、解决问题的能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力者优先;对AI技术的实际落地和突破性应用充满热情,追求技术创新与现实价值的结合; 
5、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
多模态世界模型算法工程师/专家-豆包大模型
1、本科及以上学历,计算机、电子、数学等相关专业;
2、在计算机视觉、多模态、AIGC、机器学习、渲染生成等一个或多个领域有较深入的研究者;
3、具有出色的分析、解决问题的能力,能深入解决大模型训练、应用存在的问题,有自主探索解决方案的能力者;
4、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。

加分项:
1、具有优秀的基础算法、扎实的机器学习基础,熟悉CV、AIGC、NLP、RL、ML等领域的技术,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议/期刊上发表论文者优先;
2、具有优秀的代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者优先;
3、在多模态、大模型、基础模型、世界模型、RL、渲染生成领域,主导过大影响力项目者优先。

这几个职位着重在筛选可验证的成果

  • 成果是最高权重的证据(尤其是研究/大模型算法岗)
  • 不同成果都同样成立:
    • 是否在顶会上发表过论文
    • 是否主导过项目
    • 是否具有过硬的代码基本功,并且需要看NOI/ACM/Kaggle中得奖作为可验证的证据

总的来说,学历基本上不是门槛,但是没有研究生的沉淀,我确实怀疑做出这些成果的可行性。

而且……都好难啊。

这周总的来说还是延续上周的任务:

完成这两个任务后可以尝试深入理解PI05的代码,或者开始尝试进行RFT。