阿里巴巴淘天算法技术-大模型应用算法专家-杭州
任职要求
1. 对LLM/MLLM模型、智能体(Agent)领域有深入的研究,熟悉常见LLM/MLLM模型,理解LLM的原理和架构,熟悉大模型在B/C端的应用,有行业成功应用经验。 2. 具备扎实的机器学习/深度学习基础,熟练掌握深度学习框架,如PyTorch等,并对其底层原理有深入理解;…
工作职责
1、负责淘天自营业务AI大模型的应用和研发工作,深度参与商品全链路智能运营工作、研发基于大模型的内容生成、优化的各项工作,参与ai助手和agent建设,负责大模型结合搜推相关的场景落地。 2、负责大语言模型、多模态大模型的预训练、持续训练、SFT、RLHF等技术,持续提升模型在业务场景应用的效果。 3.、深入分析业务需求,通过技术手段提升作业效率与用户体验,和工程侧同学一起探索AI相关创新产品。 4.、持续关注行业内人工智能技术的发展趋势,引入前沿技术并进行创新应用。
所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。
DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。
小红书的AI技术中台目前由ai技术部负责建设,通过标准化的AI技术能力提供支持公司各个业务团队,实现AI能力的共享和复用,提升技术资源的利用率和公司的创新迭代速度,并降低技术成本和稳定性风险 1、跟踪前沿AI算法进展,并将相应技术赋能到小红书实际的业务场景中,包括社区,商业化,交易,agi等 2、在AI平台之上构建应用层,可接触到大模型各种可能的落地场景,如知识问答,智能助理(AI取数、智能客服等场景),大模型工具(SFT)等 3、探索大模型技术在搜广推场景的落地方案
业内研究表明,生成式的推荐系统存在Scaling Law现象,Scaling Law的出现相较于现有推荐系统无法通过扩充持续提升效果的现象,提出了新的可能性。该团队负责小红书生成式推荐方向,目前已经完成了原型架构的开发和线上验证,欢迎业内在推荐/广告/搜索等领域的专家一起,共同探索生成式推荐在真实业务场景的价值。 【职位描述】 1、负责生成式推荐在小红书社区推荐&展示广告场景的研发; 2、在生成式架构下,重新思考传统推荐架构中的行为建模技术(如超长序列、多兴趣等),并在召回/排序等场景中进行应用; 3、与MLLM和架构团队配合,将其他生成式模型的知识和能力迁移进实时的生成式推荐架构中;