logo of youku

优酷优酷-大语言模型算法工程师-北京

社招全职地点:北京状态:招聘

任职要求


1、具备百亿参数大语言模型训练经验优先;熟悉数据工程,预训练,对齐调优经验优先
2、良好的数学能力,基础数学知识优异者优先
3、良好的大模型工程能…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责解决动漫影视剧preview创作相关问题
2. 负责大语言模型预训练,SFT,RL相关工作
包括英文材料
性能调优+
大模型+
还有更多 •••
相关职位

logo of liauto
校招算法

1.负责多模态融合算法、多模态大语言模型的技术探索和创新; 2. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地; 3. 探索Agent在复杂任务中的应用,实现基于LLM的复杂任务在软件研发领域场景的应用落地。

北京
logo of alibaba
社招2年以上

淘宝文本搜索算法团队是淘天集团内专注于创新和优化搜索技术的核心团队。我们的任务是通过持续研发高效、精准的搜索算法,以提升用户的在线购物体验和满意度,进而推动电商平台的商业成功。这一关键角色中,您将参与淘宝搜索功能的核心算法研究,特别是专注于搜索相关性领域和AI搜创新领域。该职位要求理解搜索引擎的工作原理,在深度语义相关性模型、大语言模型、多模态技术等技术方面有突出贡献。作为团队的核心成员,您将不仅要在您的直接工作领域推动技术突破,还要与其他方向的团队(包括召回、排序、机制等)进行全链路联动,共同推进搜索算法的整体优化。 1. 核心模型研发与创新: 负责淘宝主搜的核心算法研发,主导设计和优化面向电商场景的相关性大模型。重点投入Agentic Search、多模态(文图、视频)相关性、AI生成式搜索等前沿方向,从模型层面根本性地提升搜索相关性、用户体验和商业效率。 2. 电商知识资产构建: 主导构建电商领域的高质量多模态数据飞轮。通过知识库建设、主动学习、数据挖掘和智能标注等手段,持续迭代和优化数据质量,为大模型的训练和迭代提供核心“燃料”,沉淀公司级的电商知识数据资产。 3. 用户体验洞察与度量: 深入理解和洞察电商搜索场景下的用户意图与行为模式,建立并完善一套科学的、数据驱动的搜索体验分析与评估方法论。以量化指标和用户反馈指导模型迭代方向,确保技术创新最终服务于用户价值。 4. 前沿技术探索与应用: 密切追踪LLM(大语言模型)、MLLM(多模态大模型)、NLP、AIGC等领域的最新技术进展。快速进行技术预研、验证,并将其创造性地应用于电商搜索业务中,解决实际问题。在应用基础上进行技术创新,鼓励发表高水平论文、申请技术专利,构建团队在行业内的技术影响力。 我们提供 1. 高空间的舞台: 真实、海量、复杂且高价值的业务场景,让你的技术才能得到最大程度的发挥。 2. 前沿的技术挑战: 直接参与定义下一代AI搜索,与行业顶尖人才共同攻克最具挑战性的技术难题。 3. 充足的资源支持: 丰富的计算资源与数据资产,以及鼓励创新和试错的文化氛围。 4. 清晰的成长路径: 完善的职业发展体系和技术晋升通道,支持个人在技术深度和业务广度上的持续成长。

更新于 2026-04-08北京|杭州
logo of youku
社招3年以上

优酷目前致力于研发剧作领域的高质量辅助工具。我们深信,剧作内容的生产是大语言模型落地最有可见价值,最有意思,同时也是最有挑战的领域之一。欢迎您加入我们,和我们一起探索,一起成长,一起见证前沿算法在高质量剧作内容生产中将要创造的奇迹,“为好内容,全力以赴”! 1. 了解剧作逻辑,理解创作过程,链接剧作需求及算法原理,设计定义模型任务; 2. 设计制定高质量训练数据构造方案,完成数据制备; 3. 完成核心模型(大中型)的训练和调优。可以独立完成,也可以与他人合作,如果能指导他人完成则更好; 4. 跟进相关领域的学术及落地成果,探索在我们工作中的应用价值。

更新于 2026-02-04北京
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京