荣耀大模型强化学习算法高级工程师
任职要求
1、计算机科学、机器学习、统计学、应用数学等相关领域专业; 2、具备扎实的机器学习基础、编码能力,能够熟练掌握最新论文和技术,并熟练使用PyTorch框架进行编程; 3、具备创造性思维,能够将全新想法转化为工程应用,对研究工作充满热情,具备良好的团队合作精神和沟通能力; 4、对强化学习、人工智能和大模型技术有强烈的兴趣和热情,愿意不断学习和探索新技术; 加分项: 1、在ICML、ICLR、NeurIPS、ACL、CVPR、AAAI、IJCAI、TPAMI、TIP等顶级学术会议和期刊上发表过有影响力研究成果者优先; 2、在ACM/ICPC、NOI/IOI、Kaggle等编程/AI比赛中获奖者优先; 3、主导或参与过具有重大影响力的AI相关开源或闭源项目者优先。 招聘范围:国内和海外高校的中国籍应届博士毕业生
工作职责
1、研究大语言模型及多模态大模型的SFT和RLHF后训练方法,旨在提升大模型在相关端侧业务上的基础能力,紧跟业界大模型的技术发展; 2、探索大模型的agent应用能力,包括但不限于ReAct、Reflexion、AutoGPT、MetaGPT等LLMagent应用框架,以及强化学习智能体的规划和端到端训练方法; 3、研究用户个性化大模型的强化学习训练和应用能力,提升端侧用户体验; 4、撰写技术报告和论文,积极参与公司内外部的技术交流与合作,推动团队在大模型技术水平和业务落地能力上的提升,增强团队在行业内的影响力和知名度。
1.负责研发和实现理想汽车自动驾驶系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署。 2.专注于开发和实现创新的强化学习算法和架构,推动自动驾驶系统性能的提升,特别是在 MPI 性能方面的突破。 3.参与自动驾驶系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理。 4.跟踪强化学习和自动驾驶领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破。 5.跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。
1.负责商品合规安全业务:基于多模态算法技术,对海量商品信息(包括图片、标题描述等)进行自动化风险识别,精准检测违禁品、知识产权、资质不符等违规内容,提升高危商品的发现效率与防控准确率,保障平台商品生态的合规性与安全性 2.负责内容安全业务:利用多模态算法在海量内容中快速筛选出潜在的风险进行防控 3.负责商品审核业务:主导审核机器人能力建设,结合规则引擎与多模态大模型技术,对海量商品送审请求实现自动化智能审核,在保障审核质量的前提下大幅提升处理效率,降低人工成本
所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。