阿里云阿里云智能-算法专家(政企业务)-杭州/上海/北京
任职要求
● 计算机、人工智能等相关专业硕士及以上学历,来自海内外知名高校或实验室者优先; ● 具有扎实的算法功底,在 LLM/Speech 领域有深入的研究经历。有顶会(NeurIPS、ICML、ICLR、ACL等)论文发表者优先; ● 熟悉 LLM / Speech 模型架构以及训练和推理的技术细节; ● 熟悉 Pre…
工作职责
参与阿里云AI产品的创新研发,衔接前沿学术研究与商业化应用,基于 LLM/Speech 生成大模型,构建具备行业竞争力的产品和解决方案。 1、生成式人工智能算法的设计和调优 - 洞察先进技术,深入追踪行业技术进展,快速复现 SOTA 算法并进行内部验证 - 针对业务场景中的痛点,进行算法的选型、设计和调优 - 完成算法模块的开发、测试、工程化部署与持续迭代 - 将研究成果进行发表和开源 2、生成式人工智能算法的商业化落地 - 结合客户实际需求,设计并落地垂直领域的算法和技术方案 - 根据客户的需求与反馈,持续迭代模型性能,提升产品的商业价值
1、负责大模型服务解决方案的研发,前沿技术追踪、包括模型训练和调优、推理、RAG、AI Agent等键技术方向攻坚。 2、负责央国企重点客户的大模型落地业务场景识别、需求分析、方案规划以及服务履约落地,持续推动客户做好标准化大模型迁云、云上优化,打造具备行业影响力的大模型服务的标杆案例。 3、负责规划大模型服务的整体演进规划和落地,沉淀可复制的大模型场景服务方案,沉淀具备行业竞争力的大模型智能体服务平台。
1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。
1. 面向 AI 业务的网络架构设计与演进 ○ 负责支持大规模 AI 训练/推理集群的网络架构规划与方案设计,覆盖 AI access 网络、frontend 网络、AI scale up 网络等关键环节。 ○ 结合业务场景识别网络接入、流量调度、数据分发链路中的性能和可靠性瓶颈,提出系统级优化方案。 2. 高性能多路径传输与 RDMA 方向创新 ○ 深入调研业界前沿应用层多路径传输、RDMA 及相关协议栈优化技术,系统性分析其优缺点与适用场景。 ○ 基于阿里云大规模生产环境,设计并落地面向 AI 流量的多路径传输优化机制,实现端到端的高带宽、低时延和高稳定性。 3. 网络系统研发与产品化落地 ○ 将整体技术方案拆解为可实施的技术点,完成可行性分析、技术规范制定与验收标准设计。 ○ 主导关键模块的架构设计与核心代码开发,构建可快速迭代的原型系统,验证技术路线。 ○ 在验证基础上持续进行性能优化与工程化改造,推动方案产品化落地,并支撑大规模部署和运营。 4. 稳定性与性能优化 ○ 制定并实施面向超大规模集群的稳定性保障策略,从架构设计、协议栈实现、流控/调度策略等多层面建设高可用能力。 ○ 在真实业务环境中开展端到端性能剖析与容量规划,识别热点与瓶颈,落地针对性优化措施,保障高负载下的稳定性能表现。 5. 数智一体的网络分析与智能运维 ○ 利用大数据与大语言模型,设计并研发超大规模网络分析与智能运维系统,提升网络研发、运营、运维、测试效率。 ○ 探索 AI for Network 的创新场景,如异常检测、故障根因定位、智能调度策略优化等。 6. 学术前沿跟踪与技术影响力建设 ○ 持续跟踪计算机网络、AI infra、可编程网络硬件等领域的前沿研究与产业趋势,并评估其在阿里云场景中的落地价值。 ○ 鼓励/支持在 SIGCOMM、NSDI、ATC 等顶会发表论文或输出技术分享,增强团队和个人在业界的技术影响力。
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享