随便看看「通义」有没有自己喜欢的职位~
我们正在寻找充满激情的大模型应用开发者,共同构建大模型应用新开发范式,积极推进大模型应用落地新范式,拥抱开源社区,探索前沿研究方向。 工作内容包括: 1. 探索超前沿大语言模型强化学习算法和Agentic应用范式。 2. 参与大模型应用开发平台架构设计,积极推进MCP等开源协议赋能企业级开发平台。 3. 构建大模型轻应用,推进大模型在金融/医疗/教育等核心场景落地和赋能。
大模型为世界建模,Character Model进一步为人建模。对话智能团队,以Character Model训练和应用为核心, 建设 “有趣+有用” 的多语言、多模态类人智能体,打造了通义星尘(角色扮演&IP复刻&类人智能体)、通义晓蜜(智能客服)等大模型时代的核心产品。欢迎对大模型感兴趣的你加入我们,一起开拓大模型时代的人机对话的未来。 岗位职责: 1. 负责Character Model的研究和应用,包括但不限于 与环境交互的多轮RL、Generative Reward Models等技术。 2. 负责 “有趣+有用” 的多语言、多模态类人智能体建设,包括但不限于任务完成、共情/情感、记忆(Memory)、心智(Mind)等技术。 3. 将上述技术在通义星尘、通义晓蜜及其他创新产品中进行大规模应用落地。
1、参与Web软件的设计、开发和维护,包括但不限于PC Web站点、移动端H5/小程序、浏览器插件等不同形态的互联网应用; 2、参与AI产品(ToC、ToB、AI基础平台)的全流程,和各角色协同,完成从需求到设计、开发和上线等整个项目周期内的工作; 3、参与AI+不同场景结合的产品开发,AI+带来全新交互形式,深入音视频、图像处理、对话等不同前端领域,提供合适的前端技术解决方案; 4、深入AI工程化领域,AI Coding、模型训部署&评测、AI数据引擎等大模型核心工程场景,期待你的前端全栈的创新技能,来共同思考助推这些领域发展。
1、负责大模型应用和系统整体架构设计与演进,打造具备弹性调度能力、服务稳定、低延迟响应的全链路应用和系统; 2、主导平台的 DevInfra 能力建设,覆盖代码提交、CI/CD、灰度发布、可观测性、异常诊断与系统治理等关键模块,提升研发交付效率; 3、优化业务、平台、应用的架构设计,持续提升平台能力与技术领先性。
1、探索研究多模态理解、视频理解等方向的前沿技术。 2、关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力。
通义实验室语音工程团队主要负责通义系列模型在语音及其他更广泛的多模态交互、理解场景下的优化、落地和应用。我们在阿里云上提供业界领先、开箱即用的模型服务API,支持全世界的开发者,以及阿里集团内如钉钉、淘天、夸克等30+业务线。我们同时也在和算法科学家们共同探索最前沿模型的能力边界,构建以多模态大模型为核心的新产品,向外展示通义的技术先进性和影响力。 1. 探索多模态理解与生成大模型的技术边界,支持多模态模型的功能迭代和推理性能优化。 2. 构建极致性能的实时流式输入/输出系统,提供百毫秒级别的端到端延迟体验。 3. 建设超低延迟、高可用、可扩展的分布式模型服务系统,通过提升模型吞吐和并发,提供最普惠的AI模型服务。 4. 分析和解决复杂的软硬件技术问题,跟踪行业最新的多模态大模型和应用开发工具和技术,将最佳实践和创新集成到平台中。
1. 需求收集与分析:与内外部客户,解决方案架构师密切合作,深入收集和分析客户需求和反馈,从复杂的客户场景中提取核心需求。 2. 产品规划与设计:与研发算法团队紧密合作,对LLM基础原理,prompt编写,vision- language等模型能力有较好了解,并定义商业化策略,包括目标客户画像、产品定位和定价策略等。 3. 市场调研与竞争分析:持续跟踪行业技术趋势和竞争对手动态,进行竞争分析。 4. 跨部门协作:与技术、运营、市场等团队紧密合作,确保产品从开发到上线再到推广的全流程顺利进行。
团队介绍: LLM research 团队是隶属于阿里巴巴通义实验室的前沿研究团队,致力于解决大语言模型发展过程中的长期性、基础性挑战。我们的使命是打造具备通用智能的下一代AI系统,让模型真正具备深度推理、规划与复杂问题求解的能力,跨越任务与领域边界,从而在各类真实任务中展现可靠而深刻的智能。 1. 有效评估模型能力:建立系统性的评估方法与指标,准确刻画模型的行为表现与能力边界。 2. 探索模型的能力缺陷:挖掘当前主流模型在关键任务中的局限,理解其失败模式与成因。 3. 理解模型训练机制与问题:深入剖析大模型训练中的核心机制与潜在问题,为新范式设计提供理论支持。 4. 定义与探索更优训练范式:在实践中推动训练方法的演进,从而训练出更强大、更可靠、更智能的模型。