字节跳动机器学习系统研发工程师-Data
任职要求
1、本科及以上学历,计算机、软件工程、人工智能等相关专业; 2、深入理解机器学习系统,熟悉主流机器学习框架及其实现原理(如Pytorch、Tensorflow等); 3、熟悉Linux内核、…
工作职责
1、负责机器学习系统性能分析组件的开发,优化,稳定性改善; 2、参与机器学习性能分析系统的前沿探索,满足业务需求; 3、负责机器学习系统底层问题的分析与调试,提高稳定性和兼容性。
1. 构建基于机器学习或深度学习模型的在线识别系统,保证极高精准和召回的前提下,实时处置无效流量或风险物料; 2. 建设强大的离线挖掘平台,使用多种无监督、半监督手段帮助算法和运营同学探索新的异常pattern; 3. 研发风控产品平台,服务阿里妈妈和淘天集团更多相关的业务,不断提升迭代效率。每年为广告主挽回损失过百亿元,同时为平台拦截百亿以上的风险物料。
1. 构建基于机器学习或深度学习模型的在线识别系统,保证极高精准和召回的前提下,实时处置无效流量或风险物料。 2. 建设强大的离线挖掘平台,使用多种无监督、半监督手段帮助算法和运营同学探索新的异常pattern。 3. 研发风控产品平台,服务阿里妈妈和淘天集团更多相关的业务,不断提升迭代效率。每年为广告主挽回损失过百亿元,同时为平台拦截百亿以上的风险物料。
1. 开发并优化货架容器 2D/3D 识别、定位与姿态估计算法,输出高鲁棒抓取位姿。 2. 机械臂运动学/动力学建模及逆解求解;轨迹规划与实时优化算法,抓取策略及柔顺控制算法开发。 3. 研发手眼标定、闭环视觉伺服与多传感器融合算法。 4. 引入并部署基于Autoregressive/Diffusion Models/VLA的端到端具身智能模型(如 RT series、π0、octo)。 5. 探索 Diffusion Policy、Imitation Learning、Reinforcement Learning等前沿方法,实现从视觉到动作的自监督或弱监督学习。 6. 搭建大规模数据采集、自动标注和自回放管线(Data Flywheel),持续迭代模型并进行线上 A/B 性能监控。 7. 与运动控制、系统集成团队密切协作,完成算法量化部署、边缘推理加速及实时监控告警。
1、参与设计与研发快手服务亿级用户的端到端机器学习平台,构建高性能、分布式、可扩展的AI数据计算/存储引擎,通过数据驱动模型生产,支撑包括推荐、广告、搜索、大模型等核心AI算法业务的高效迭代; 2、打造业界领先的AI数据引擎,包括高性能实时/离线分布式计算系统、流批一体化的AI数据湖存储系统、SQL化DSL描述的下一代数据处理平台,为百万核规模、EB级数据的高效计算、存储、迭代提供易用可靠的基础设施; 3、与算法工程师、研究员团队紧密配合,深刻理解端到端的AI模型研发流程,探索业界前沿的Data4AI技术,负责模型研究中数据工程方案的架构设计、实现、持续迭代和稳定性维护。