字节跳动Devops/运维开发工程师-Data AML
任职要求
1、掌握Python/Golang中至少一种语言,并具扎实编码能力; 2、掌握MySQL、Redis、MQ等常用存储系统的使用,具备一定的问题排查和调优能力; 3、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,良好的团队合作精神; 4、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档。 加分项 1、有搜索系统,推荐系统等上层业务系统项目经验/运维经验优先; 2、对于分…
工作职责
1、保障机器学习系统的稳定运转; 2、负责核心服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性; 3、负责分布式系统的监控与指标建设; 4、负责在离线集群的云平台化、资源优化、SLA保障。
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、保障机器学习系统的稳定运转; 2、负责核心服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性; 3、负责分布式系统的监控与指标建设; 4、负责在离线集群的云平台化、资源优化、SLA保障。
1、保障机器学习系统的稳定运转; 2、负责核心服务的持续集成和交付,高效和自动化的运维优化,提升服务的稳定性; 3、负责分布式系统的监控与指标建设; 4、负责在离线集群的云平台化、资源优化、SLA保障。
1)负责网易游戏雷火事业群下游戏宣发增长业务的后端开发,确保系统的稳定性、可扩展性和安全性; 2)使用 Golang 和 Gin 等技术进行高质量的代码编写,对BUG零容忍; 3)参与微服务架构的设计和实现,重构优化现有系统提升性能优化资源利用; 4)参与团队技术方案设计与团队成员共同开发和维护 RESTful API,提高接口的易用性和稳定性; 5)参与团队内部技术分享和培训,促进团队技术的成长和交流。
1.你是网络大牛,热衷于专研云网络技术的奥秘;亦或是有技术热情的潜力派,希望揭开云网络的神秘面纱,那么欢迎加入腾讯云网络测试团队,我们致力于腾讯云IAAS层云网络的质量保障工作,为腾讯云提供强大、稳定的网络通讯服务,支撑云上海量业务; 2.在这里,你可以深入接触相关腾讯云网络产品,类如:私有网络、负载均衡、自定义防火墙、专线网络和NAT网关等; 3.在这里,你还可以深入运用并学习相关Overlay网络技术,类如:Vxlan、GRE、L2/L3网络协议、IPSec、NAT原理、OSPF、BGP和ISIS等; 4.在这里,你还可以深入接触Linux下前沿网络流量转发技术,类如:DPDK、OVS、智能网卡、FPGA和P4; 5.在这里,你还可以深度参与腾讯云DevOps流程建设与相关运营工作,并且可以参与设计优化自动化测试框架进行相关自动化测试工作; 6.加入我们,与业内最优秀的同事并肩,成为网络测试大牛,见证云网络技术的发展,创造业务的一个个里程碑; 7.负责腾讯云产品需求和架构分析,测试设计和测试开发工作,包括IaaS层如计算、网络和虚拟化等,包括但不限于功能测试,性能测试,可靠性测试,高可用测试,混沌测试,稳定性测试,用户体验等系统测试工作; 8.对测试方案进行有效的落地和执行,以确保项目进度和质量,形成自动化测试用例并进一步形成服务化提升效率; 9.架构并实现IaaS层如网络、虚拟化等产品自动化测试平台,提升产品测试和交付能力; 10.不断提升测试过程、方法和技术,构建质量评估标准,优化改进措施,提升产品质量和效率; 11.设计、构建并落地各产品自动化构建、测试和发布的工程基础设施和流程优化; 12.注:此岗位位腾讯集团旗下子公司编制。