顺丰自然语言处理工程师(博士后)
任职要求
1.博士学历,具备优秀的沟通能力,学习能力,有强烈的上进心和主动性; 2.熟练使用C++/Java/Python,熟悉Pytorch和TensorFlow等框架; 3.熟悉或精通基于预训练+微调的方式完成NLP模型优化,并解决实际生产的性能优化问题; 4.熟悉或精通对话大模型调优相关技术,包括但不限于SFT、RLHF(RM、PPO); 5.有大模型相关优化经验(如ChatGLM、LLaMA、baichuan)优先,具备多模态AIGC大模型项目经验者优先。
工作职责
1.负责相关领域的数据收集、清洗、送标、微调、效果评估工作; 2.负责大模型相关算法的设计、调试并训练,包括但不限于GPT、Llama、baichuan等模型训练、SFT、RLHF及相关Prompt Engineering; 3.使用向量数据库、langchain、大模型构建大模型应用服务,构建并持续完善大模型算法流水线; 4.跟进前沿技术发展,结合业务场景引进行业先进实践,保障技术先进。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
1. 负责多模态大模型的构建,包括数据处理和构造、预训练和后训练算法优化,评测benchmark的构建等 2. 负责多模态大模型的下游算法及应用研究,包括图文问答、视频问答、搜索增强、统一理解和生成模型、多模态创作、多模态总结、多模态检索等; 3. 负责多模态大模型在移动端场景的算法优化和应用落地,包括视觉文本处理、UI界面理解和操作、function call等能力的提升 4. 跟进业界前沿技术,持续提升团队在多模态算法方面的技术积累。
1、参与高德车道级地图算法研发工作,负责将深度学习、多模态大模型等技术与地图专业领域知识结合; 2、参与最前沿的生成式建图等领域模型研发,结合SFT/RLHF/RAG方向的前沿算法持续提升业务效果天花板; 3、负责地图大模型的后训练和应用落地,与工程同学配合,完善整体链路,推进应用上线; 4、跟踪行业最新论文动态,将先进技术应用到业务当中。