字节跳动AI算法架构师-Code AI方向-国际化短视频-北京/上海/深圳
任职要求
1、本科及以上学历,计算机、软件相关专业,5年及以上研发工作经验,3年以上AI算法应用经验; 2、精通深度学习的实践方法,有把深度学习模型应用到大型产品和服务中去的丰富经验;熟悉Bert、GPT3等预训练模型,对相关任务技术有深入理解(如模型训练、prompt设计、 instruct微调、模型工程化…
工作职责
1、设计、开发和优化国际化短视频平台上的AI应用,提升用户体验和平台效率; 2、探索新的AI技术和算法,将其整合到国际化短视频的研发体系中; 3、参与构建和优化下一代研发体系,提高团队的研发效率和创新能力; 4、与跨职能团队密切合作,理解业务需求,为国际化短视频的发展提供AI技术支持; 5、负责研究和解决在AI应用开发中遇到的挑战和问题。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心,是致力于AI基础设施建设和创新研究的部门,探索行业领先的人工智能技术,包括大语言模型,多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法,为用户带来更好的内容消费体验。在Code AI方向,我们利用大语言模型强大的代码理解与推理能力,提升程序性能与研发效率。 1、参与设计并实现高可用、可扩展、分布式大模型机器学习平台,支撑国际化短视频大模型研发与高效迭代; 2、探索业界前沿的大模型工程研发(LLMOps)相关技术,覆盖数据、训练、推理服务、评测、自动化编排、Prompt工程、资源调度等方向; 3、构建高性能大模型推理服务架构,降低推理成本,保障服务高可用运行。
团队介绍: 平台技术是阿里国际集团技术创新和业务支撑的核心团队,以构建全球领先的数据+智能+跨云一体化数字化技术基础设施为目标,倾力打造合规、稳定、高效且用户体验卓越的技术服务平台。 我们基于全球化架构与数字智能技术,构建坚实合规的全球化商业底座。采用先进的微服务架构、混合云最佳实践以及智能模块化设计,有效提升业务响应速度和灵活性。通过技术创新驱动研发模式的代际演进,聚焦敏捷开发、先进生产工具、自动化运维流程,践行AI和云原生时代的DevOps文化。打造技术产品和研发规范,构筑起全方位的安全防护屏障。依托数据平台,基于大数据分析、机器学习等先进技术手段,构建强大的数据中台和智能决策支持系统。我们的终端技术专注于提升用户的数字化交互体验,结合智能时代的人机交互范式和网络技术,为全球用户提供极致流畅、个性智能的产品体验 职位描述 1. 产品规划与落地: 负责基于海量电商数据,规划并设计数据智能 Agent 产品(如:商机挖掘,用户洞察,智能取数助手、Text-to-SQL 工具、自动化数据分析报告)。 2. 技术转化与应用: 深入最新AI领域的技术最新在数据分析领域的应用(如 Agent 框架、RAG 检索增强、Text-to-SQL 准确率优化、Code Interpreter 等),将前沿技术转化为可落地的产品功能,解决传统的痛点。 3. 跨部门协作: 与 ETL 工程师、数据分析师、算法团队紧密配合,业务 多部门合作,梳理电商业务“语义层”或“知识库”和工作流程。 4. 场景挖掘与运营: 深入业务一线,挖掘运营、采销、管理层的数据使用场景,推广 AI 数据工具。通过用户行为数据分析,优化 Agent 的交互体验,提升内部或外部客户的数据获取效率。
【我们期待你】在这里,你不会只做简单的UI堆砌。你将作为技术团队的新生力量,深度参与到国际化产品的架构治理与工程化建设中,在资深导师的带领下,攻克性能瓶颈与合规挑战。 【你将获得】 1、硬核技术成长:直接接触千万级日活产品的架构演进过程,学习业界前沿的性能优化与工程化方法论。 2、专属导师带教:资深架构师/技术专家 1V1 指导,定期 Code Review,帮助你养成顶级的编程习惯。 3、广阔的国际视野:深入了解全球化业务场景,积累跨国互联网产品的开发经验。 工作职责: 1、业务与架构开发:参与海外社区产品(App/Web)核心功能模块的开发;在导师指导下,协助进行老旧代码的重构、模块解耦与组件化改造,提升代码质量。 2、性能优化实践:参与性能优化专项(如启动速度、页面渲染、包体积瘦身等),负责性能数据的采集、监控报警配置以及具体优化点的落地执行。 3、合规与隐私支持:协助团队进行海外数据安全与隐私合规的技术改造,处理代码静态扫描发现的合规漏洞,确保产品符合 GDPR/CCPA 等国际标准。 4、技术调研与提效:探索前沿技术(如 AI 辅助编码工具、跨端新技术),参与自动化工具脚本的编写,帮助团队提升研发效率。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。