快手【快Star-X】GenAI异构计算架构与优化工程师
任职要求
1、技术能力: 精通Linux环境下C/C++和Python开发,扎实的计算机体系结构、操作系统、编译原理基础。 深入理解深度学习框架底层实现(如TensorFlow/PyTorch的计算图优化、运行时调度等)。 熟悉至少一种主流异构计算架构(如NVIDIA CUDA、AMD ROCm、Google TPU等)及其编程模型。 具备高性能算子开发、…
工作职责
1、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型与深度优化,构建面向业务场景的算力评估体系。 2、主导AI推理引擎在目标芯片上的设计与实现,实现毫秒级低延迟与高吞吐推理能力。 3、优化大规模模型训练框架的设计与实现,提升分布式训练效率,缩短模型迭代周期。 4、开发高性能算子库,突破芯片算力瓶颈,最大化硬件利用率。 5、推动异构编程范式革新,降低模型迁移成本,提升开发效率。
1. 负责淘宝闪购营销算法,包括平台补贴定价、商家智能营销、店品价格机制、商流X物流联动等; 2. 负责用户全生命周期体验与成长,促进拉新和留存; 3. 参与营销创新性算法的研究及开发工作; 4. 协同业务进行跨团队合作。
1.负责alibaba国际站 数字营销的前端架构设计及研发,保障系统的安全、可扩展以及质量和性能,与PD、UED、Java 工程师协作,完成设计交互实现、数据交互、动态信息展现 2.关注用户体验,与合作方一起不断改进产品的易用性;运用AI能力重塑 广告后台BP、广告前台创意 的产品形态,提升用户体验和客服效能 3.研究和探索创新的开发思路和新的前端技术,结合业务特点创新应用AI技术,解决前端团队开发过程中面临的各类问题,提升个人和团队的开发效能 4.参与跨境B类全球化创意中心的规划建设,包括可视化制作、可视化渲染、D2C、自动化审核、自动化生产、智能诊断等,推动协助相关团队并落地未来产品和系统规划
【团队介绍】 小红书技术中台AI应用算法团队专注于图文、视频等场景下的大语言模型、多模态模型、扩散模型等技术的落地应用,通过标准化的AI技术能力支持公司各业务团队,提升技术资源利用率和业务创新迭代速度,持续优化技术研发成本并提升大规模AI应用的系统稳定性。团队兼具活跃的技术氛围、一线业务的真实挑战和相对充足的计算资源,欢迎有志于AGI、AIGC等方向的同学加入。 1、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易等,持续推动AGI在业务场景下的落地应用; 2、基于成熟的AI平台服务,构建完善的AI原生应用和X+AI应用,包括如智能助理、知识问答、深度研究等,打造具有核心用户价值的热点应用; 3、探索大语言模型、多模态模型、扩散模型等在搜广推场景的落地方案。