logo of quark

夸克智能信息-高级数据算法工程师/专家-多模态方向

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 具备扎实的数据结构与并发编程能力,熟悉高效文件I/O与分布式文件系统;
2. 熟练使用主流图像与视频处理工具和库(如 OpenCV、FFmpeg、PyAV),具备复杂场景下的处理经验;
3. 具备在 CPU 和 GPU 上优化及并行化数据处理流程的能力;
4. 熟悉用于机器学习训练数据的数据标注与cap…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。
1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理;
2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化;
3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据;
4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集;
5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成);
6. 将来自用户偏好的数据来源转化为可用于训练的格式;
7. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
包括英文材料
数据结构+
OpenCV+
机器学习+
还有更多 •••
相关职位

logo of cxmt
社招3年以上研发技术类

深入业务视角,以多模态大数据建模及计算物理仿真为基础,借助AI赋能,帮助半导体工程/工艺/元件特性先行预测与优化,提升工程/工艺/元件研发效率。 工作职责: 1.基于半导体工程/工艺/元件研发需求,开发AI Agent,实现研发流程的自动化与智能化; 2.结合大模型技术(如LLM、多模态大模型等),构建智能化的业务交互与决策系统,提升研发效率; 3.基于产品全生命周期的生产大数据,开发根因查询(RCA)、虚拟量测(VM)、高级工艺控制(APC)、高级机台控制(AEC)等智能化解决方案; 4.开发基于业务驱动的智能工程/工艺/元件设计优化工具,结合物理信息神经网络(PINN)、复杂结构数字孪生、先进材料自动选型等技术,实现研发创新; 5.与半导体研发工程师深入合作,理解业务逻辑,打通数据流,设计并开发能够替代工程师重复操作的AI Agent; 6.探索大模型及AI Agent在半导体研发中的应用场景,推动AI技术与业务需求的深度融合。

更新于 2025-09-19合肥
logo of sf
社招5-10年

基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).

更新于 2026-01-06上海
logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州
logo of alibaba
社招1年以上技术类-算法

团队介绍 AE 推荐算法团队负责AliExpress所有推荐类相关产品的算法研发,包括商品信息流、图文、短视频等众多场景的推荐,致力于用AI先进技术对商品&内容进行挖掘和理解,提升流量分发效率和用户体验,服务于全球243个国家数十亿消费者: 职位描述 1. 负责跨境电商场景中的用户理解,利用超大规模深度学习对用户长短期兴趣进行建模与实时意图预测 2. 负责推荐商品召回,包括i2i召回、深度个性化召回、多兴趣表达与匹配等 3. 负责优化推荐排序大模型,利用大规模深度学习技术对商品进行表征&个性化排序 4. 负责推荐流量机制与策略研发,包括新品、新用户的投放策略与调控机制

更新于 2025-10-22杭州