logo of quark

夸克智能信息-高级数据算法工程师/专家-多模态方向

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 具备扎实的数据结构与并发编程能力,熟悉高效文件I/O与分布式文件系统;
2. 熟练使用主流图像与视频处理工具和库(如 OpenCV、FFmpeg、PyAV),具备复杂场景下的处理经验;
3. 具备在 CPU 和 GPU 上优化及并行化数据处理流程的能力;
4. 熟悉用于机器学习训练数据的数据标注与cap…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。
1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理;
2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化;
3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据;
4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集;
5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成);
6. 将来自用户偏好的数据来源转化为可用于训练的格式;
7. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
包括英文材料
数据结构+
OpenCV+
机器学习+
还有更多 •••
相关职位

logo of quark
社招4年以上技术类-算法

1. 负责搜索场景多模态内容相关的召回、排序、策略等算法设计与优化(如笔记/视频) 2. 负责超大规模深度学习在用户建模、CTR预估、多场景迁移学习等领域中的应用 3. 负责用户表征学习、向量化召回、兴趣发现等在视频搜索/推荐分发场景内的应用 4. 负责分发场景的流量机制分配、冷启动、用户增长等策略设计与应用

更新于 2025-12-04北京
logo of cxmt
社招3年以上研发技术类

深入业务视角,以多模态大数据建模及计算物理仿真为基础,借助AI赋能,帮助半导体工程/工艺/元件特性先行预测与优化,提升工程/工艺/元件研发效率。 工作职责: 1.基于半导体工程/工艺/元件研发需求,开发AI Agent,实现研发流程的自动化与智能化; 2.结合大模型技术(如LLM、多模态大模型等),构建智能化的业务交互与决策系统,提升研发效率; 3.基于产品全生命周期的生产大数据,开发根因查询(RCA)、虚拟量测(VM)、高级工艺控制(APC)、高级机台控制(AEC)等智能化解决方案; 4.开发基于业务驱动的智能工程/工艺/元件设计优化工具,结合物理信息神经网络(PINN)、复杂结构数字孪生、先进材料自动选型等技术,实现研发创新; 5.与半导体研发工程师深入合作,理解业务逻辑,打通数据流,设计并开发能够替代工程师重复操作的AI Agent; 6.探索大模型及AI Agent在半导体研发中的应用场景,推动AI技术与业务需求的深度融合。

更新于 2025-09-19合肥
logo of quark
社招2年以上技术类-开发

1. 负责夸克服务端(搜索、网盘、文档、扫描王和AI工具等相关业务)技术体系的系统分析、设计,并主导完成详细设计和编码的任务,确保项目的进度和质量;主导技术难题攻关,持续提升核心系统的高处理性能。 2. 能够在团队中完成Code Review的任务,确保相关代码的有效性和正确性,并能够通过Code Review提供相关性能和稳定性的建议。 3. 理解业务,识别需求,参与架构、系统、分析设计等多领域项目的相关技术的实践、应用和研发。 招聘范围:P5-P8

更新于 2025-11-27北京|杭州|广州
logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州