logo of pinduoduo

拼多多【商业化】机器学习架构工程师(训练和推理方向)

社招全职技术类地点:上海状态:招聘

任职要求


1、熟悉Linux开发环境,精通C++/Python,具备扎实编程基础,具备高性能系统开发经验;
2、具备主流深度学习TensorFlow、PyTorch、ONNX Runtime、vLLM等任一框架的使用、开发经验
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责设计与开发分布式模型训练系统,支持千亿参数的PS架构和万亿参数的Transformer架构,优化算力异构集群;
2、设计开发高性能模型推理服务,优化低延迟、高并发、高稳定性的推理系统,满足搜广推场景毫秒级响应需求;
3、优化训练和推理中的性能瓶颈,通过升级架构、算子优化、访存优化、量化技术等压榨硬件算力;
4、优化大模型的训练和推理速度,调研开发DeepSeek、Megatron、DeepSpeed、vLLM等模型和框架的落地;
5、与算法团队紧密合作,针对业务需求(CTR/CVR、大语言模型、强化学习等),推动新技术在场景中的应用。
包括英文材料
Linux+
C+++
Python+
深度学习+
还有更多 •••
相关职位

logo of bilibili
实习技术类

1.负责设计、研发和优化商业化模型推理服务和训练服务。 2.负责商业化广告相关模型业务的持续迭代。 3.负责商业化模型工程架构的持续迭代和发展。

更新于 2025-06-09上海
logo of bilibili
社招3-5年技术类

1. 负责设计、研发和优化商业化模型推理服务和训练服务。 2. 负责商业化模型工程架构的持续迭代和发展。 3. 负责推动先进的模型技术应用于商业化业务场景。 4. 负责提升离在线服务的性能,优化资源分配和治理。

更新于 2025-04-07上海
logo of bytedance
社招5年以上A206687B

1、负责容器服务平台在AI领域的架构设计演进以及商业化产品开发,研究AI技术和场景跟云原生技术的结合; 2、负责容器服务平台针对AI业务的高性能、稳定性优化;结合机器学习、云原生、公有云架构,提升资源利用率; 3、提炼用户需求和打磨产品,调研国内外产品,让产品和技术具备业界领先的差异化竞争力; 4、关注云原生在AI方向的发展,构建AI云原生容器服务平台产品化能力。

更新于 2025-02-08杭州
logo of bytedance
社招5年以上A21315

1、负责容器服务平台在AI领域的架构设计演进以及商业化产品开发,研究AI技术和场景跟云原生技术的结合; 2、负责容器服务平台针对AI业务的高性能、稳定性优化;结合机器学习、云原生、公有云架构,提升资源利用率; 3、提炼用户需求和打磨产品,调研国内外产品,让产品和技术具备业界领先的差异化竞争力; 4、关注云原生在AI方向的发展,构建AI云原生容器服务平台产品化能力。

更新于 2025-02-08上海