logo of dingtalk

钉钉钉钉-大模型应用算法专家-杭州

社招全职5年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 研究生及以上学历,计算机科学、人工智能、数学、统计学等相关专业。
2. 具备3年以上NLP深度学习算法研发经验,其中包含至少1年以上大语言模型(LLM)相关的项目实战经验。
3. 对大语言模型技术栈有深入的理解和实践经验,包括但不限于SFT、RM、RLHF、Prompt Engineering、Instruction Tuning、Data Synthesis等。
4. 精通Python,熟练掌握PyTorch深度学习框架;对Transformer、MoE等主流模型架构有深刻认知;具备优秀的软件工程素养和扎实的C++/Python代码能力。
5. 须持有钉钉官方认证的《AI应用工程师》中高级证书…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与大模型Post-Training(SFT, RM, RLHF等)算法的研发与迭代,深入研究并解决训练过程中的效率瓶颈与收敛性问题,持续提升模型的逻辑、推理及生成能力,直接对用户体验负责。
2. 探索并实践面向各领域的高质量数据自动化合成技术(如Self-Instruct, Constitutional AI等),设计并构建高效、可扩展的线上数据飞轮(Data-Flywheel)闭环系统,实现模型能力的自我迭代与增强。
3. 与产品、工程团队紧密协作,洞察并挖掘LLM在企业垂直场景的巨大潜力,参与从0到1的创新产品孵化,推动技术成果的商业化落地。
包括英文材料
学历+
NLP+
深度学习+
算法+
大模型+
SFT+
Prompt+
Python+
PyTorch+
还有更多 •••
相关职位

logo of alibaba
社招3年以上技术类-算法

所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。

更新于 2025-09-23杭州
logo of xiaohongshu
社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳
logo of xiaohongshu
社招3年以上大模型

小红书的AI技术中台目前由ai技术部负责建设,通过标准化的AI技术能力提供支持公司各个业务团队,实现AI能力的共享和复用,提升技术资源的利用率和公司的创新迭代速度,并降低技术成本和稳定性风险 1、跟踪前沿AI算法进展,并将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易,agi等 2、在AI平台之上构建应用层,可接触到大模型各种可能的落地场景,如知识问答,智能助理(AI取数、智能客服等场景),大模型工具(SFT)等 3、探索大模型技术在搜广推场景的落地方案

北京|上海|杭州
logo of xiaohongshu
社招3年以上大模型

业内研究表明,生成式的推荐系统存在Scaling Law现象,Scaling Law的出现相较于现有推荐系统无法通过扩充持续提升效果的现象,提出了新的可能性。该团队负责小红书生成式推荐方向,目前已经完成了原型架构的开发和线上验证,欢迎业内在推荐/广告/搜索等领域的专家一起,共同探索生成式推荐在真实业务场景的价值。 【职位描述】 1、负责生成式推荐在小红书社区推荐&展示广告场景的研发; 2、在生成式架构下,重新思考传统推荐架构中的行为建模技术(如超长序列、多兴趣等),并在召回/排序等场景中进行应用; 3、与MLLM和架构团队配合,将其他生成式模型的知识和能力迁移进实时的生成式推荐架构中;

北京|上海|杭州