随便看看「通义」有没有自己喜欢的职位~
我们正在寻找充满激情的大模型应用开发者,共同构建大模型应用新开发范式,积极推进大模型应用落地新范式,拥抱开源社区,探索前沿研究方向。 工作内容包括: 1. 探索超前沿大语言模型强化学习算法和Agentic应用范式。 2. 参与大模型应用开发平台架构设计,积极推进MCP等开源协议赋能企业级开发平台。 3. 构建大模型轻应用,推进大模型在金融/医疗/教育等核心场景落地和赋能。
大模型为世界建模,Character Model进一步为人建模。对话智能团队,以Character Model训练和应用为核心, 建设 “有趣+有用” 的多语言、多模态类人智能体,打造了通义星尘(角色扮演&IP复刻&类人智能体)、通义晓蜜(智能客服)等大模型时代的核心产品。欢迎对大模型感兴趣的你加入我们,一起开拓大模型时代的人机对话的未来。 岗位职责: 1. 负责Character Model的研究和应用,包括但不限于 与环境交互的多轮RL、Generative Reward Models等技术。 2. 负责 “有趣+有用” 的多语言、多模态类人智能体建设,包括但不限于任务完成、共情/情感、记忆(Memory)、心智(Mind)等技术。 3. 将上述技术在通义星尘、通义晓蜜及其他创新产品中进行大规模应用落地。
1、设计并实现高性能AI原生网关。构建低延迟、高并发的API网关系统,支持多模态、多协议接入,为国内及全球客户提供灵活、安全、可扩展的流量接入方案,提供完整的数据面控制与可观测能力; 2、打造智能推理调度与资源管理系统。设计并实现面向复杂分布式推理场景的请求调度和资源调度系统,结合动态负载特征与异构硬件资源,持续优化请求分发策略;建设Serverless化资源调度架构,实现资源的弹性伸缩与极致利用率提升; 3、构建先进的MLOps平台能力。深度优化模型服务的CI/CD流程,推动算法研发到生产部署的自动化与标准化;实现模型版本管理、灰度发布、监控告警、性能分析等全生命周期管理能力,提升迭代效率与系统稳定性。
1、负责大模型应用和系统整体架构设计与演进,打造具备弹性调度能力、服务稳定、低延迟响应的全链路应用和系统; 2、主导平台的 DevInfra 能力建设,覆盖代码提交、CI/CD、灰度发布、可观测性、异常诊断与系统治理等关键模块,提升研发交付效率; 3、优化业务、平台、应用的架构设计,持续提升平台能力与技术领先性。
1、负责人工智能相关产品的数据和算法等场景测试,并基于算法和工程团队现有质量问题给出合理化的建议和解决方案,推动落地实现算法质量提高; 2、协同算法团队和工程团队进行全面的质量把控和风险监控; 3、参与数据和算法的质量系统建设,完善算法全链路质量保证能力,提交算法落地和工程效率。
1、探索研究多模态理解、视频理解等方向的前沿技术。 2、关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力。
在蕴含丰富世界知识的预训练模型的基础上,我们利用 Post-train 打造出我们想要的能够服务人类的 AI 模型。我们通过 RL、SFT、RFT 等技术,探索大模型潜能的同时,也在塑造大模型的能力与性格。本着为人类服务的目标,我们的 Post-train 将会重点探索其推理能力,实现深度思考,并致力于提升其 Agent 能力,让大模型服务于真实世界的任务。 工作职责: 1. 探索更多可 scalable 的 verifier 信号,并通过 RL 提升模型的各项能力。 2. 提升 reward model 在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias。 3. 研究 reasoning path压缩和外推,实现更高质量的推理思考。 4. 将LLM的推理能力和Agent以及其他模态相结合,探索统一模态的reasoning。
1. 需求收集与分析:与内外部客户,解决方案架构师密切合作,深入收集和分析客户需求和反馈,从复杂的客户场景中提取核心需求。 2. 产品规划与设计:与研发算法团队紧密合作,对LLM基础原理,prompt编写,vision- language等模型能力有较好了解,并定义商业化策略,包括目标客户画像、产品定位和定价策略等。 3. 市场调研与竞争分析:持续跟踪行业技术趋势和竞争对手动态,进行竞争分析。 4. 跨部门协作:与技术、运营、市场等团队紧密合作,确保产品从开发到上线再到推广的全流程顺利进行。