小红书【27/28届实习】多模态/NLP 算法工程师-交易算法
任职要求
1、本科及以上学历,计算机等相关专业优先; 2、在机器学习,数据挖掘,统计学理论,最优化理论等领域有着深厚积累; 3、有搜索、推荐、广告、NLP、图像识别等相关背景优先,熟悉机器学习,NLP、数据挖掘、知识工程的经典算法,并能在业务中灵活解决实际问题,有过大规模搜索/推荐/广告系…
工作职责
1、参与小红书社区内容理解体系构建,负责直播和笔记多模态信息结构化算法建设和应用; 2、参与小红书电商多模态识别和知识图谱体系建设,负责面向业务的商品类目、属性、SPU体系建设; 3、参与商家商品侧基础识别模型建设,包括多模态分类、标签挖掘等识别算法,并配合业务应用落地到平台管理系统; 4、参与供应链上下游平台算法建设,基于小红书社区数据挖掘商机、供给源、流程趋势,并落地到B端系统工具; 5、负责相关算法和系统的持续迭代和进化; 同时能够深入小红书丰富的业务场景,结合实际需求进行技术落地和创新;
加入社区平台消费研发团队,社区核心业务团队,深度参与小红书核心场景(主框架、图文详情、视频内流)功能开发。在这里你可以: 1、获得丰富的锻炼机会,充分挖掘你的潜力;一对一mentor指导帮助你更好的成长; 2、和产品经理配合,深度参与产品需求讨论、功能定义;从设计到发布,亲手打造一个产品功能; 3、参与做性能、架构等方面的改进与优化,满足你对于技术的任何追求。
1、参与大规模分布式训练框架的研发与优化,支持VLA等多模态大模型的高效预训练,微调,强化学习,量化感知训练与推理; 2、设计并实现数据并行、模型并行、张量并行、序列并行等混合策略的自动编排系统; 3、进行端到端性能瓶颈分析(通信、计算、内存、IO),优化千卡/万卡集群的训练效率与稳定性; 4、构建训练容错、弹性伸缩、成本感知调度等企业级特性,支撑物理AI业务的快速迭代。
1、研发面向自动驾驶与机器人场景的 embodied agent 决策算法,探索 RLHF / RLAIF、offline RL、online RL、imitation learning 与 world model 的联合优化,提升 Agent 在真实环境中的长程规划与任务执行能力; 2、设计奖励函数、verifier、safety shield 与仿真环境,系统解决稀疏奖励、安全约束、信用分配、泛化性与 sim2real 迁移等核心问题; 3、构建高层 planner 与低层 policy 的分层优化框架,结合 VLM/VLA、状态估计、工具调用与环境反馈,实现 perception-planning-action 的闭环决策; 4、建立 agent 训练与评测体系,围绕任务完成率、规划深度、规则遵循、异常恢复、样本效率、实时性与安全性开展系统评估和迭代; 5、参与真实车端/机端的算法部署、灰度验证与数据回流,推动从仿真到现实、从 demo 到闭环系统的持续优化。
