夸克智能信息-夸克-Post-Training 高级算法专家-北京/杭州
任职要求
● 计算机科学、人工智能、电子工程或相关领域的硕士或博士学位。 ● 在顶级学术会议 (NeurIPS, ICML, ICLR, ACL, EMNLP 等) 发表过相关高质量论文。 ● 在自然语言处理 (NLP) 或大模型 (LLM/VLM) 领域拥有 3 年以上的研发经验,对 Post-training 技术(SFT, RLHF, DPO, PPO、RLVR 等)方向拥有深厚的理论功底和业界公认的成功实践案例。 ● 对深度学习和机器学习有精深的理解,尤其熟悉 Transformer、MoE 等前沿模型架构。在强化学习 (RL) 领域有扎实的理论基础,并主导过其在 LLM 中的创新应用。 ● 具备卓越的工程实现能力,精通 Python 及主流深度学习框架 (PyTorch/TensorFlow)。 ● 具备出色的算法设计与分析能力,能够独立设计、执行和分析复杂的模型实验。 ● 具备优秀的领导力、项目管理能力和团队协作精神,能够带领团队攻克技术难关,并与算法、工程、评估等团队高效协作。 ● 对前沿技术充满热情,具备出色的问题分析和解决能力,能够将研究成果有效应用于实际业务场景。
工作职责
岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。
1. 主导AI训练平台任务调度系统与队列管理架构设计,优化大规模分布式训练任务的资源调度策略与执行效率 2. 开发高并发任务调度算法,解决资源抢占、优先级调度、故障恢复等核心问题,保障万卡级集群资源利用率 3. 构建智能队列管理系统,支持弹性配额、动态优先级调整、故障任务自动迁移等高级功能,满足LLM/VLM等大模型训练需求 4. 负责调度系统可观测性建设与性能优化,培养调度领域技术团队
1.负责阿里巴巴国际站(Alibaba.com)的品牌、创意及营销设计工作,涵盖品牌体系构建、品牌活动策划、营销推广设计、营销IP形象打造、社交媒体视觉呈现等项目。 2.主导输出行业领先且具备国际顶尖水准的设计方案,并对设计行业发展趋势保持深刻洞察。 3.拥有卓越的实战能力,通过经验传授、方法论沉淀及流程培训,确保设计作品的高质量交付。 4.具备全球设计供应商资源的整合与管理能力。 1. Responsible for brand, creative and marketing design of Alibaba.com, Including brand system, brand campaign, marketing promotion, marketing IP, social media and other design projects. 2. Responsible for producing the most industry-leading and international top level design solutions, and having profound insight into the development of design industry. 3. Excellent hands-on ability. Experience, methods, process training to ensure the quality of design works. 4. Able to integrate and manage global design suppliers.
1.提供卓越的顾客体验: 热情友好地欢迎顾客,了解他们的需求,并提供个性化的解决方案,超越他们的期望。 2.产品专家: 深入了解所有 小米产品硬件软件知识、服务知识,并能够清晰简洁地向顾客解释其功能和优势,是门店团队学习与寻找产品帮助的对象。 3.销售与服务: 积极倾听顾客需求,推荐合适的产品和服务,完成门店销售目标,同时,能处理顾客咨询、技术支持。 4.团队合作: 与团队成员紧密合作,共同营造积极向上的工作氛围,并为顾客提供无缝衔接的服务体验。 5.辅助门店管理:协助店长管理店铺的日常营运,如销售分析、陈列整理、顾客服务、库存、活动的制定和执行等。 6.保持学习: 积极参与公司组织的培训,不断学习新的产品知识、销售技巧和服务理念,以保持领先地位。 ---------------------------------------------------------------------------------------------------------------------------------------- 1.Provide an excellent customer experience: Welcome customers warmly and friendly, understand their needs, and offer personalized solutions to exceed their expectations. 2.Product expert: Have an in-depth understanding of the hardware and software knowledge of all Xiaomi products as well as service knowledge, and be able to clearly and concisely explain their functions and advantages to customers. You should be the person that the store team turns to for product learning and assistance. 3.Sales and service: Actively listen to customers' needs, recommend suitable products and services, and achieve the store's sales targets. Meanwhile, be capable of handling customer inquiries and providing technical support. 4.Teamwork: Collaborate closely with team members to jointly create a positive and upbeat working atmosphere and provide customers with a seamless service experience. 5.Assist in store management: Assist the store manager in managing the daily operations of the store, such as sales analysis, display arrangement, customer service, inventory management, and the formulation and implementation of activities. 6.Keep learning: Actively participate in the training organized by the company, and continuously acquire new product knowledge, sales techniques, and service concepts to stay ahead of the competition.
1、领导可扩展、可靠的AI基础设施(AI加速器、计算集群、存储、网络)的端到端设计,用于Training和Inference大模型工作负载; 2、定义并实现面向服务的容器化架构(Kubernetes、VM框架、Unikernels),优化ML性能和安全性; 3、分析和优化ML堆栈的每一层ML编译器、GPU/TPU调度、NCCL/RDMA网络、数据预处理和训练/推理框架,开发低开销Metrics和基准测试框架,以识别和消除分布式训练和Inference中的瓶颈; 4、构建和运营跨多个数据中心(本地和云)自动扩展的大规模部署和编排调度系统,通过智能资源管理和工作负载放置来支持容错、高可用性和成本效益; 5、为PB级大模型数据集量身定制强大的ETL和数据摄取管道(Spark/Beam/Dask/Flume),集成实验管理和工作流编排工具(Airflow、Kubeflow、Metaflow)以简化研究到生产的过程; 6、与机器学习研究人员合作,将原型需求转化为生产级系统,指导工程师在性能调整、系统设计和可靠性工程方面的最佳实践。