logo of 58

58同城大模型资深算法工程师-1(J29105)

社招全职3年以上技术类地点:北京状态:招聘

任职要求


1. 3年以上NLP/NLU领域算法工作经验,硕士以上学历,计算机、人工智能、数学等相关专业
2. 良好的编程能力,熟悉java/Python编程语言,熟练使用TensorFlowPytorch中至少一种框架
3. 精通大模型相关领域的基本概念和技术,包括但不限于传统NLP模型(如TextCNN、FastText、ELMo)、预训练模型(BERT、ERINE)及生成式预训练模型(GPT、BLOOM、GLM)的原理及使用
4. 一定的科研能力,能快速学习并使用新技术,能阅读并理解相关领域论文
5. 较强的数据分析和解决问题能力,较强的团队协作能力,良好的文档及宣讲能力。
6.具备业界典型大模型(如ChatGLM2、BELLE、CAMA、MOSS、Aqulia)预训练和微调经验者、
熟悉大模型的分布式优化算法,熟练掌握如DeepSpeed Chat、Colossal-AI Chat等分布式RLHF系统者、
在国内大中型互联网负责过大模型相关项目开发工作者优先。

工作职责


1.负责基于五八同城多条业务线需求的垂直领域大模型的研究、设计、开发和优化工作
2.与产品经理及后端开发紧密合作,与需求方深入沟通,利用大模型赋能线上已有业务场景并基于大模型能力创造新的业务场景。
3.设计并产出各场景下大模型的效果评估方案,持续关注线上数据,对系统及算法上的不足及时改进并推动实现
4.跟进大模型领域最新进展,了解行业前沿动态,不断迭代大模型相关算法模块,实现产品愿景及目标
包括英文材料
NLP+
算法+
学历+
Java+
Python+
TensorFlow+
PyTorch+
大模型+
BERT+
GPT+
数据分析+
DeepSpeed+
相关职位

logo of didi
社招3年以上技术

1. 参与大模型应用开发,包括但不限于Agent搭建并应用在集团各业务中; 2. 与产品团队紧密合作,理解业务需求,设计并实现大模型解决方案,包括系统设计、微调、推理以及各环节优化; 3. 调研并探索SFT/RLHF方向前沿算法、框架,持续提升垂类模型的效率与效果。

更新于 2025-05-14
logo of ctrip
社招3年以上商旅业务AI &

1、负责大语言模型相关技术(知识注入、指令对齐、深度推理、知识围栏等)的算法研究和应用落地,具备自然语言处理、对话系统、语义理解、文本检索,强化学习等方向的研发经验。 2、参与对话意图、对话管理、对话生成、人机协同、知识检索、情感分析等场景的模型的训练和迭代,包括数据清洗、微调、测试; 3、积极探索前沿技术并结合旅游业务场景微调大模型,提高大模型在特定任务上的泛化效果。

更新于 2025-01-23
logo of xiaohongshu
社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对 AI 技术有信仰的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的智能技术。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态,以未来几年 AI 技术的质变突破为目标。 岗位说明:你会负责下述至少一件事情 1.海量的多模态数据处理:定性分析、定量评估数据质量,并给出 scalable 的改进方案,协助搭建多模态的数据流程; 2.搭建多模态的模型架构,在多种技术方案中找到 trade off 的关键,搭建更高效且可扩展的模型框架 3.研究并改进多模态模型的 Scale Law,随着模型的变化给出 Large Scale 上的技术选择(例如参数/数据比、不同超参数设置等)

更新于 2025-08-13
logo of xpeng
社招

1. 负责自动驾驶端到端模型系统的研发与量产。

更新于 2025-03-12