
得物算法工程实习生
任职要求
【必备项】 1、本科及以上学历,计算机、软件、人工智能、信息安全、网络安全、通信等相关专业优先; 2、熟练Java语言,具有扎实Java功底。熟悉Java虚拟机原理、Java高级特性和类库、Java网络与服务器编程、Java多线程编程; 3、熟悉常用的数据结构和算法,熟练掌握Spring,Mybatis,Springboot等常用的Java框架; 4、熟悉常规的分布式架构,熟悉缓存、消息队列、flink实时计算等开源中间件; 5、 对常用的开发软件熟悉,如git、idea等 6、具备独立工作能力和解决问题的能力、善于沟通、勤于思考、乐于合作、善于总结分享;有强烈的责任心和团队合作精神,积极融入团队。 【加分项】 1、有互联网公司实习经验,参与过互联网软件等相关产品开发项目优先; 2、在相关领域国际顶级会议、期刊发表论文,或相关学术会议组织的权威比赛中获奖优先; 3、热衷于ACM,在校期间参与过大学生数学建模竞赛等优先; 4、作为骨干参与过学生网站的建设和开发优先。
工作职责
1、负责得物电商搜索、推荐场景的数据dump、召回、粗排、精排相关业务功能的开发、架构设计及优化; 2、参与搜索引擎工程链路各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求; 3、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作; 4、参与海量数据处理和开发,通过sql、pl/sql、java进行etl程序开发,满足商业上对数据的开发需求;
【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:隐私和数据保护办公室,负责与法律/安全/Eng/Prod/OPs团队合作,在隐私和数据保护领域支持字节跳动相关国际化产品。 1、优化大模型Prompt,提高模型的响应质量和准确性;学习并应用最新的算法和技术,提高模型的性能; 2、清理、处理和准备用于训练和验证的海量数据集,确保数据质量和一致性,为模型训练提供可靠的数据基础; 3、进行模型的训练和测试,参与数据标注和结果分析;实验新算法和模型结构,记录和分析实验结果; 4、开发和维护与模型相关的后端服务和API,实现高效的服务器端代码,确保系统的稳定性和高效性; 5、提供技术支持,解决模型在实际应用中的问题;撰写技术文档,总结实验结果和经验教训。
你将深度参与以下模块的设计、验证和优化: [1] 感知:让 Agent 理解复杂多变的用户界面,将海量的、异构的、实时的场景信息高效可靠地转化为结构化的 item。 [2] 记忆:让 Agent 拥有仿生的长短期记忆,通过多路召回等策略,组合聊天历史、用户画像和召回结果,为Agent 的每一次决策提供最关键的上下文。 [3] 决策: 构建自主的 Agentic Workflows,让 Agent 学会在恰当的时机,以恰当的方式与用户交互。 此外,你还需要参与建立一套自动化的、数据驱动的评测框架,用于客观、全面地衡量Agent在真实世界任务中的表现,驱动工程策略的快速迭代。