logo of kuaishou

快手研发线大模型算法专家-R1 推理模型

社招全职3年以上D12518地点:北京状态:招聘

任职要求


1、3年以上算法经验,有大模型项目经历者优先;
2、对数据挖掘机器学习深度学习NLP等技术有深刻的理解和应用经验;
3、熟悉Python/Java等编程语言,有良好的编程习惯;
4、熟悉Hive/MapReduce/Spark/Storm/Flink等工具和平台;
5、熟悉pytorch/TensorFlow/maxnet等深度学习平台;
6、对数据敏感,有较强数据分析和解决问题能力;
7、具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于分析问题/解决问题。

加分项: 
1、以一作发表过优秀期刊或顶会论文; 
2、获得机器学习竞赛优异成绩。

工作职责


团队介绍:负责大语言模型技术在快手智能研发场景的研究和应用,负责代码生成大模型的性能优化和定制化改进,以提升公司整体研发效率为目标,推动大模型技术在代码理解、代码自动生成、代码审核等研发流程中的落地应用。主要工作方向包括:
1、为公司研发团队提供基于更高性能代码生成大模型的编码辅助工具;
2、探索推理加速、超长上下文能力等大模型优化方法;
3、数据建设、指令微调、偏好对齐等模型训练范式优化。
包括英文材料
算法+
大模型+
数据挖掘+
机器学习+
深度学习+
NLP+
Python+
Java+
编程规范+
Hive+
MapReduce+
Spark+
PyTorch+
TensorFlow+
数据分析+
相关职位

logo of antgroup
社招3年以上技术类-算法

团队介绍: 数字支付智能技术团队,专注于支持支付业务的增长(包括线下支付和线上支付)。该职位主要聚焦于支持线下“碰一下”的支付和数字化业务场景,涵盖支付C端增长和支付B端增长,通过算法应用帮助业务提升效率并贡献增量价值,共同创造新的“碰一下”创新赛道。 职位描述: 方向一:大模型技术研发与场景落地基于大模型构建支付场景智能化解决方案(营销策略生成、Multi-Agent协作系统、RAG知识问答等)开发面向支付业务的领域大模型,优化模型推理效率与场景泛化能力 方向二:多模态数据融合与价值挖掘通过多模态技术实现商户POI识别、经营画像构建与场景理解构建跨模态检索与生成系统,提升支付生态数据利用率

更新于 2025-08-24
logo of bytedance
社招3年以上A08838

1、负责字节跳动互娱研发泛质量方向各业务场景下,LLM算法在需求设计、开发、测试、线上等软件工程领域的应用研究与算法落地工作,提升研发、测试的效率和质量,业务场景包括但不限于需求风险分级/智能单测/用例生成/UI生成/代码图谱/智能测试等; 2、跟踪LLM领域的最新研究成果,用以持续提升算法应用效果,研究方向包括但不限于语言LLM、多模态LLM,Prompt工程/RAG/Agents/SFT/RLHF等LLM相关前沿技术; 3、深度参与产品研发项目,和产品经理/业务研发/业务质量/运营等同学密切配合,提高项目整体效率和收益。

更新于 2024-08-21
logo of amap
社招3年以上技术类-算法

我们需要NLP方向和推荐方向的算法专家,负责对地图生产资料、互联网情报、搜索日志、用户反馈等非结构化文本进行分析和信息抽取,负责理解高德用户的到达行为,融合人地大数据,构建知识图谱和智能推理能力,打通数据生产和前台业务,使得用户获得更加智能的出行和服务体验。 1、参与和负责POI产线的NLP算法部分,包括POI的NLP基础功能服务、多模态名称融合生成、名称质检模块、名称纠错模块等; 2、搭建POI的NLP基础服务平台,实现以POI为核心实体的地图数据图谱,为高德的POI搜索、推荐业务提供完备信息; 3、配合其他POI采集、挖掘、调度、聚合业务,建模NLP任务,提供准确且有效的NLP信息; 4、积极地探索和研究NLP的应用和认知领域,结合地图场景,提供更加全面且完备的服务; 5、参与和负责POI的XGC业务,包括相关性召回、各级转化率模型,提升用户的答题率,答题的转化率模型; 6、积极地挖掘高德的人地相关性,推动用户与POI问题的推荐逻辑,提升高德场景的搜推基建和技术。

更新于 2025-09-08
logo of alibaba
社招3年以上

智能服务算法团队聚焦大模型在淘宝服务场景下的落地与探索, 团队内技术氛围浓厚, 拥有丰富的大模型落地经验和海量的对话、图像、音频、视频等数据,团队不断利用前沿的大模型技术,打造极致的用户服务体验。岗位核心工作包括: 1. 深入到场景,通过对数据定量分析和论证,抽象出相应的核心问题,对场景问题进行全方位的评估和拆解; 2. 综合考虑业务目标和大模型推理效率,设计相应的大模型方案方案,包括且不限于agent的设计、微调的设计等; 3. 突破现有的基础模型限制,利用前沿的动态推理长度、多模态技术,突破现有模型在场景落地上的技术瓶颈; 4. 通过SFT、RL等技术,提升基模在领域的推理能力,大幅提升特定场景下的模型效果; 5. 有完整的链路设计能力,协同各方完成模型的部署、验证和线上优化。

更新于 2025-07-28