logo of quark

夸克千问C端事业群-夸克-搜索内容理解(NLP/CV/多模)算法专家-杭州

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 具备扎实的编程基础,熟悉常用的数据结构算法,具备良好的代码风格和编程习惯。
2. 理解大模型的技术原理,有多模态大模型数据处理相关项目经验者优先考虑
3. 有良好的沟通表达能…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界!

1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。
2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。
3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。
4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。
包括英文材料
数据结构+
算法+
编程规范+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 内生安全是近年来大语言模型研发中的一个关键研究方向。随着模型能力的快速增长,特别是推理模型,通过慢思考LongCoT的方式极大的提升了能力达到专家水平,然而强大能力也带来了潜在的安全风险。内生安全的目标是通过设计模型架构、推理机制或训练流程,使得模型在底层逻辑中具备一致性、自我审查和误差控制的能力,从本质上降低安全隐患,而不是简单依赖筛查和围栏过滤。 对于推理模型的内生安全而言,其主要难点在于 1. 可解释性不足,缺乏启发式策略和理论的结合。没有对推理模型有专门的内生安全性质的定义,形成数学的框架 2. 对抗能力缺失。由于模型较新且运行成本大,目前已有的jailbreak方法依赖大量试错的尝试,很难形成有效的攻防相互促进 3. 动态推理过程的监督。由于推理模型将思考过程进行展示,以往工作只关注在最后模型回复阶段,忽略了推理过程可能包含的风险 因此,可以再一下方向进行相关研究 1. 安全高效评估框架:针对推理模型研发专门的red team方法进行内生安全评估 2. 对抗训练:提出高效的对抗方法,通过posttrain方式提升内生安全 3. 内生安全奖励:在GRPO过程中,除了回复的helpful,也考虑harmless 4. 多模态场景下的推理安全:对图文视频音频等多模态输入,均在思考过程中进行安全检查等

上海|杭州
logo of xiaohongshu
社招3年以上大模型

【职位描述】 1、负责小红书搜广推多场景排序模型优化,提升时长、互动、留存等核心指标; 2、分析海量用户行为数据,挖掘用户兴趣,优化排序模型; 3、通过超大规模机器学习模型和系统,使用先进的排序算法优化推荐效果。

上海|北京
logo of didi
社招技术

1. 负责万亿级别QPS的分布式缓存/存储集群,支撑公司所有产品线的业务需求; 2. 设计、研发高可用、高性能的缓存/存储架构和中间件,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向; 3. 优化系统性能,深入内核,提升基础服务相关资源的使用率,增加系统稳定性,保障业务运行; 4. 设计并研发自动化运维平台,提升运维质量和效率,探索运维自动化和智能化技术和方向。

更新于 2025-04-01北京
logo of ctrip
社招5年以上住宿业务AI &

我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。

更新于 2025-04-01上海