logo of aliyun

阿里云瓴羊-全栈开发专家-数据采集方向-杭州/北京

社招全职5年以上技术类-前端地点:杭州状态:招聘

任职要求


1、计算机相关专业本科及以上学历,5年以上Android,iosweb小程序数据采集经验;
2、精通Python,熟悉HTTP/HTTPS协议、HTML/XML解析(如BeautifulSoup、XPath、lxml);
3、熟悉主流爬虫框架(如Scrapy、Playwright、Selenium、puppeteer);
4、熟悉数据库操作(MySQL、MongoDB等),具备数据存储与处理能力;
5、了解基本的反爬机制及应对方案(如验证码识别、IP池管理);
6、熟悉常见 Android Java层和native层的hook攻防方案;
7、熟悉 Androidios app 常用加壳、混淆、异常环境监测机制;
8、熟悉 网络通讯、代理机制,抓包、https、ssl pinning 、proxy机制;
9、熟练使用 Fiddler,Charl…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、研究并实现高并发、分布式的网络爬虫系统,支持大规模数据采集需求
2、逆向Android/ios app、sdk、web和小程序,脱壳、反编译、抓包、拦截、加解密破解和数据传输分析等
3、开发数据清洗、存储及自动化处理流程,对接数据库或大数据平台(如MySQL、MongoDB、Hadoop、OSS、ODPS、Redis等)
4、优化爬虫性能,提升数据抓取效率与成功率,降低资源消耗
5、与数据、产品各方协作,支持智能营销业务场景(如营销日历、营销策略、营销内容生成等)落地
包括英文材料
学历+
Android+
iOS+
Web+
小程序+
Python+
HTTP+
HTML+
XML+
Playwright+
还有更多 •••
相关职位

logo of tongyi
社招8年以上技术类-开发

1.技术与系统架构:负责具身智能与机器人系统的整体架构设计,并主导机器人平台化(硬件模块、控制栈、感知栈)与大模型平台化(数据、训练、推理)的统一设计。 2.具身智能大模型工程:建设数据体系,协同科研模型算法团队推进具身大模型训练,协同、调用云平台搭建面向具身场景的大规模训练与分布式基础设施。 3.端侧模型推理部署:负责将具身智能模型在机器人端侧部署,并结合机器人计算资源进行软硬件协同优化。 4.机器人系统落地与工程交付:主导机器人在各类场景的落地与项目交付;负责从需求拆解、系统集成、工程实现、测试验证到交付运营的全流程工程管理;协调与供应链、ODM/OEM、硬件厂商的技术对接,以及机器人产业上下游的合作。 5.团队管理与跨部门协作:管理多学科工程团队,建立工程和研发流程(CI/CD、QA、仿真体系、回归测试、可靠性验证),并与产品、科研、算法、行业解决方案和 BD 团队紧密协作推进关键项目落地。

更新于 2026-02-11北京|杭州
logo of aligenie
社招8年以上技术类-开发

1.技术与系统架构:负责具身智能与机器人系统的整体架构设计,并主导机器人平台化(硬件模块、控制栈、感知栈)与大模型平台化(数据、训练、推理)的统一设计。 2.具身智能大模型工程:建设数据体系,协同科研模型算法团队推进具身大模型训练,协同、调用云平台搭建面向具身场景的大规模训练与分布式基础设施。 3.端侧模型推理部署:负责将具身智能模型在机器人端侧部署,并结合机器人计算资源进行软硬件协同优化。 4.机器人系统落地与工程交付:主导机器人在各类场景的落地与项目交付;负责从需求拆解、系统集成、工程实现、测试验证到交付运营的全流程工程管理;协调与供应链、ODM/OEM、硬件厂商的技术对接,以及机器人产业上下游的合作。 5.团队管理与跨部门协作:管理多学科工程团队,建立工程和研发流程(CI/CD、QA、仿真体系、回归测试、可靠性验证),并与产品、科研、算法、行业解决方案和 BD 团队紧密协作推进关键项目落地。

更新于 2026-04-03北京|杭州
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 工作职责: 1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、参与/负责KV Router、PD分离/EPD分离、KVCache管理、动态PD调整等分布式推理能力建设; 3、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 4、参与/负责构建推理框架的系统容错能力,包括但不限于请求迁移、优雅退出、故障检测、自愈等能力建设; 5、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 6、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。

更新于 2026-03-28北京|上海