logo of quark

夸克智能信息-高级数据算法工程师/专家-多模态方向

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 具备扎实的数据结构与并发编程能力,熟悉高效文件I/O与分布式文件系统;
2. 熟练使用主流图像与视频处理工具和库(如 OpenCV、FFmpeg、PyAV),具备复杂场景下的处理经验;
3. 具备在 CPU 和 GPU 上优化及并行化数据处理流程的能力;
4. 熟悉用于机器学习训练数据的数据标注与caption流程;
5. 熟悉大规模图像/视频数据清洗和预处理的流程;
6. 具备数据可视化与分析能力,能够辅助研发团队理解数据分布与问题特征。
加分项:
1. 参与过文生图、文生视频、多模态生成理解、AIGCs基座模型开发的经验优先;
2. 熟悉大数据处理框架(如 Apache SparkHadoop)优先。

工作职责


致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。
1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理;
2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化;
3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据;
4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集;
5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成);
6. 将来自用户偏好的数据来源转化为可用于训练的格式;
7. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
包括英文材料
数据结构+
OpenCV+
机器学习+
Apache+
Spark+
Hadoop+
相关职位

logo of quark
社招4年以上技术类-算法

1. 负责搜索场景多模态内容相关的召回、排序、策略等算法设计与优化(如笔记/视频) 2. 负责超大规模深度学习在用户建模、CTR预估、多场景迁移学习等领域中的应用 3. 负责用户表征学习、向量化召回、兴趣发现等在视频搜索/推荐分发场景内的应用 4. 负责分发场景的流量机制分配、冷启动、用户增长等策略设计与应用

更新于 2025-09-04
logo of cxmt
社招3年以上研发技术类

深入业务视角,以多模态大数据建模及计算物理仿真为基础,借助AI赋能,帮助半导体工程/工艺/元件特性先行预测与优化,提升工程/工艺/元件研发效率。 工作职责: 1.基于半导体工程/工艺/元件研发需求,开发AI Agent,实现研发流程的自动化与智能化; 2.结合大模型技术(如LLM、多模态大模型等),构建智能化的业务交互与决策系统,提升研发效率; 3.基于产品全生命周期的生产大数据,开发根因查询(RCA)、虚拟量测(VM)、高级工艺控制(APC)、高级机台控制(AEC)等智能化解决方案; 4.开发基于业务驱动的智能工程/工艺/元件设计优化工具,结合物理信息神经网络(PINN)、复杂结构数字孪生、先进材料自动选型等技术,实现研发创新; 5.与半导体研发工程师深入合作,理解业务逻辑,打通数据流,设计并开发能够替代工程师重复操作的AI Agent; 6.探索大模型及AI Agent在半导体研发中的应用场景,推动AI技术与业务需求的深度融合。

更新于 2025-09-19
logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10
logo of alibaba
社招1年以上技术类-算法

AE 推荐算法团队负责AliExpress所有推荐类相关产品的算法研发,包括商品信息流、图文、短视频等众多场景的推荐,致力于用AI先进技术对商品&内容进行挖掘和理解,提升流量分发效率和用户体验,服务于全球243个国家数十亿消费者: 1. 负责跨境电商场景中的用户理解,利用超大规模深度学习对用户长短期兴趣进行建模与实时意图预测 2. 负责推荐商品召回,包括i2i召回、深度个性化召回、多兴趣表达与匹配等 3. 负责优化推荐排序大模型,利用大规模深度学习技术对商品进行表征&个性化排序 4. 负责推荐流量机制与策略研发,包括新品、新用户的投放策略与调控机制

更新于 2025-09-29