西门子西门子中国研究院 大模型强化学习研究员(上海、北京、苏州)
任职要求
• Master's or Doctor degree or above in Computer Science, Automation, Mathematics or related. • Self-motivated, good communication skills and good team player. • Ability to handle multiple competing priorities in a fast-paced environment. The skills you are expected to have: • 1~3 years of hands-on RL experience (academic or industry). • Expertise in deep RL algorithms (model-based/model-free) and frameworks (e.g., RLlib, Gymnasium). • Strong Python skills with PyTorch/TensorFlow and proficiency in Linux. • Experience with distributed training (Horovod, DeepSpeed) and cloud platforms (AWS/Azure/Alicloud). • Familiarity with LLM agents or LLM post-training. • Prefer: Backgroun…
工作职责
We empower our people to stay resilient and relevant in a constantly changing world. We're looking for people who are always searching for creative ways to grow and learn. People who want to make a real impact, now and in the future. Does that sound like you? Then it seems like you'd make a great addition to our vibrant international team. DAI AIX – AI Acceleration and Exploration, is working on the cutting-edge research of Data Analytics and AI with Siemens global technology network, and consulting, co-creation, data driven applications for the end customers. Research Scientist is to do applied research for Industrial AI applications in the team. We are seeking a Reinforcement Learning (RL) Specialist to lead the design, implementation, and optimization of RL-driven systems for post-training of foundation models. The primary focus of this role is advancing our RL capabilities for real-world applications such as industrial control systems and LLM agents. You will develop cutting-edge algorithms, improve post-training efficiency, and deploy scalable RL solutions in industry. You'll make an impact by • 1. Reinforcement learning development for post-training: • Design and implement state-of-the-art RL algorithms (e.g., PPO, SAC, DQN) for post-training of foundation models like LLMs and time series foundation models. • Implement distributed RL training pipelines using frameworks like Ray RLlib, Deepspeed, or custom solutions. • Design and implement benchmark pipelines for model evaluation. • 2. Align foundation models like LLMs and time series foundation models with specific areas/tasks through techniques like SFT, RL. • 3. Coding & Infrastructure: • Write production-grade Python code using PyTorch, numpy, and pandas. • Manage Linux-based clusters for distributed training and deployment. • 4. All other support required by the line manager if necessary.
滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。其支付业务,已经覆盖了全球十多个国家,在中国互联网公司出海中出类拔萃。 自2021年开始,滴滴Fintech在拉美地区大力发展电子支付和信贷业务。短短2年时间,其个人信贷业务,已经在墨西哥的Fintech玩家中位于第一梯队;其电子钱包业务也在巴西的Fintech玩家中也名列前茅,实现快速增长。此外,滴滴Fintech还在拉美地区积极探索和开展信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务,实现多个从0到1的突破。 我们诚挚邀请真诚、 可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮。和滴滴Fintech一起,实现从0到1,从1到100的快速成长 职位描述: 1、参与并完成风控平台基建研发,包括决策引擎、特征平台、核身、模型、名单、图数据库、监控平台、Databus等多个方向 2、建设提效工具,提升风控研发流程的效率。 3、积极跟其他团队沟通和配合,推动项目进展,讨论并提出有建设性的意见。
滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。其支付业务,已经覆盖了全球十多个国家,在中国互联网公司出海中出类拔萃。 自2021年开始,滴滴Fintech在拉美地区大力发展电子支付和信贷业务。短短2年时间,其个人信贷业务,已经在墨西哥的Fintech玩家中位于第一梯队;其电子钱包业务也在巴西的Fintech玩家中也名列前茅,实现快速增长。此外,滴滴Fintech还在拉美地区积极探索和开展信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务,实现多个从0到1的突破。 我们诚挚邀请真诚、 可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮。和滴滴Fintech一起,实现从0到1,从1到100的快速成长 职位描述: 1、参与并完成风控平台基建研发,包括决策引擎、特征平台、核身、模型、名单、图数据库、监控平台、Databus等多个方向 2、建设提效工具,提升风控研发流程的效率。 3、积极跟其他团队沟通和配合,推动项目进展,讨论并提出有建设性的意见。
滴滴国际化Fintech业务,是滴滴国际化战略的重要组成板块。其支付业务,已经覆盖了全球十多个国家,在中国互联网公司出海中出类拔萃。自2021年开始,滴滴Fintech在拉美地区大力发展电子支付和信贷业务。短短2年时间,巴西电子钱包业务也在巴西的Fintech玩家中也名列前茅,实现快速增长。此外,滴滴Fintech还在拉美地区积极探索和开展现金贷、信用卡、商户收单等业务,为当地用户带来更便捷、优质、更高性价比的金融服务,实现多个从0到1的突破。我们诚挚邀请真诚、可靠、勇于挑战的您和我们一起,携手并肩,拥抱金融出海的浪潮。和滴滴Fintech一起,实现从0到1,从1到100的快速成长。 1. 负责支付金融业务的营销领域的系统设计和研发工作,包括但不限于核心业务、运营支撑等领域,为研发质量和系统稳定性负责。 2. 有机会主导并深度参与多个0-1、或1-100的关键项目建设,参与系统规划、讨论,共同打造业界领先的支付、金融平台。 3. 有机会学习并理解金融行业知识,了解海外的支付和金融市场,成为有国际化视野的技术专家。 4. base地:上海/北京
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。