logo of xiaohongshu

小红书数据采集实习生

实习兼职数据后端地点:上海状态:招聘

任职要求


1、熟练掌握各种数据抓取手段、并对各种手段的优缺点有理解
2、至少掌握java/Python中一种语言的基础开发
3、熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


遵循robots协议,爬取互联网上允许搜索爬虫采集的公开信息
包括英文材料
Java+
还有更多 •••
相关职位

logo of netease
社招网易有道

一、岗位工作内容 (一)大模型数据处理与标注 1.对大模型生成的数学题结果,依据数学知识准确判断答案对错,并按规范进行标注。 2.深度剖析答案解析过程,核查其准确性与逻辑性,若有错误或不清晰处详细记录。 3.围绕数学题从多方面标注关键信息,如难度、知识点等,助力大模型优化。 4.结合大模型标注结果,对其标注结果进行数据分析。 (二)数据采集工作 1.依照词典笔更新需求规划数据采集方案,明确采集途径与时间安排。 2.严格检查采集数据质量,按标准分类存储,为词典笔迭代提供有力数据支撑。 二、岗位要求 (一)知识技能 1.数学功底扎实,熟悉小初高大学数学知识,能精准判断数学题答案与解析。 2.掌握数据采集流程与工具,会基本信息检索与处理,了解数据标注流程规范。 (二)个人素质 1.工作认真负责,对数据质量高度负责,注重细节。 2.学习能力强,能快速掌握新知识技能以适应工作。 3.具备团队协作精神,能与同事有效沟通合作。 (三)教育背景 本科在读及以上学历,数学、统计学、计算机科学、信息管理等相关专业优先。 (四)其他要求 1.每周出勤 5 天,实习时长最少3个月,4个月以上优先。 2.熟练使用 Word、Excel 等办公软件。

更新于 2025-06-18北京
logo of xiaohongshu
实习内容理解

工作职责: 1. 真实业界数据的处理分析:定性分析、定量评估数据质量、对数据采集和处理方案不断优化改进; 2. 模型开发:参与Qwen、Llama等开源LLM的训练微调、量化和部署实践,追踪业内前沿,达到领先的性能指标; 3. 结合小红书丰富的工业场景,根据实际业务需求进行技术落地和创新。

更新于 2025-10-22北京
logo of xiaohongshu
实习引擎

1、GPU集群效能优化:参与面向大模型训练&推理场景万卡规模GPU集群效能优化,包括但不限于集群调度、在离线混部、GPU虚拟化、故障快速恢复、存储&网络加速,提升大规模GPU集群的整体吞吐与资源利用率 2、LLMOps建设优化:参与大模型训练&推理引擎与下游云原生平台深度融合,构建面向大模型训练、微调、推理、部署全流程LLMOps,支撑大模型在公司内生产链路稳定、高效落地

北京
logo of ctrip
实习集团职能部门公司

负责行业分析相关的数据信息采集,归类,分析。参与公司投资项目的研究分析(特别是早期项目筛选阶段)。在收到投资团队指示后独立高效地完成任务;承担团队部分行政性事务。

更新于 2025-05-16上海