logo of honor

荣耀大模型强化学习算法高级工程师

校招全职研发类地点:上海状态:招聘

任职要求


1、计算机科学、机器学习、统计学、应用数学等相关领域专业;
2、具备扎实的机器学习基础、编码能力,能够熟练掌握最新论文和技术,并熟练使用PyTorch框架进行编程;
3、具备创造性思维,能够将全新想法转化为工程应用,对研究工作充满热情,具备良好的团队合作精神和沟通能力;
4、对强化学习、人工智能和大模型技术有强烈的兴趣和热情,愿意不断学习和探索新技术;
加分项:
1、在ICMLICLRNeurIPS、ACL、CVPR、AAAI、IJCAI、TPAMI、TIP等顶级学术会议和期刊上发表过有影响力研究成果者优先;
2、在ACM/ICPC、NOI/IOI、Kaggle等编程/AI比赛中获奖者优先;
3、主导或参与过具有重大影响力的AI相关开源或闭源项目者优先。

招聘范围:国内和海外高校的中国籍应届博士毕业生

工作职责


1、研究大语言模型及多模态大模型的SFT和RLHF后训练方法,旨在提升大模型在相关端侧业务上的基础能力,紧跟业界大模型的技术发展;
2、探索大模型的agent应用能力,包括但不限于ReAct、Reflexion、AutoGPT、MetaGPT等LLMagent应用框架,以及强化学习智能体的规划和端到端训练方法;
3、研究用户个性化大模型的强化学习训练和应用能力,提升端侧用户体验;
4、撰写技术报告和论文,积极参与公司内外部的技术交流与合作,推动团队在大模型技术水平和业务落地能力上的提升,增强团队在行业内的影响力和知名度。
包括英文材料
机器学习+
PyTorch+
强化学习+
大模型+
ICML+
NeurIPS+
CVPR+
Kaggle+
相关职位

logo of liauto
社招自动驾驶

1.负责研发和实现理想汽车自动驾驶系统中的强化学习算法,针对端到端大模型的训练范式进行优化,确保算法在车端平台的高效部署。 2.专注于开发和实现创新的强化学习算法和架构,推动自动驾驶系统性能的提升,特别是在 MPI 性能方面的突破。 3.参与自动驾驶系统的分布式训练框架建设,优化计算资源和内存瓶颈,支持大规模模型的高效训练与推理。 4.跟踪强化学习和自动驾驶领域的最新技术进展,推动新技术的实验验证和应用落地,推动技术前沿的突破。 5.跨团队紧密合作,确保 AI 模型在生产环境中部署,满足高性能和高可靠性的要求。

logo of alibaba
社招3年以上技术类-算法

1.负责商品合规安全业务:基于多模态算法技术,对海量商品信息(包括图片、标题描述等)进行自动化风险识别,精准检测违禁品、知识产权、资质不符等违规内容,提升高危商品的发现效率与防控准确率,保障平台商品生态的合规性与安全性 2.负责内容安全业务:利用多模态算法在海量内容中快速筛选出潜在的风险进行防控 3.负责商品审核业务:主导审核机器人能力建设,结合规则引擎与多模态大模型技术,对海量商品送审请求实现自动化智能审核,在保障审核质量的前提下大幅提升处理效率,降低人工成本

更新于 2025-09-01
logo of alibaba
社招3年以上技术类-算法

所在团队负责阿里国际贸易平台上的所有推荐产品,包括猜你喜欢、详情页推荐、个性化楼层等。团队通过大数据和深度学习建模,帮助平台上买卖家快速达成生意。来到这里,你将有机会深度接触到业界的计算平台和深度学习算法,并将算法技术转化为商业价值。具体地,你将有机会负责: 1. 用户画像、召回、排序和策略等模块的技术规划和算法设计,通过技术创新提升买卖家匹配效率。 2. 通过大规模深度学习和图学习,在面对数据稀疏和多国家多行业的情况下对用户实时兴趣、CTR预估、询盘和交易转化预估等问题建模。 3. 通过多样性和发现性策略,拓展用户需求,提升兴趣发现能力,进一步完善和提升推荐侧的产品价值。 4. 探索大语言模型+搜推的创新应用方向,LLM在推荐领域下的全链路建设,包括但不限于大规模的预训练、SFT、LoRA和RLHFL等技术,落地大语言模型+搜推的新的应用落地场景(如生成式推荐等)。

更新于 2025-09-23
logo of alibaba
社招技术类-算法

我们是AliExpress广告算法团队,该岗位负责AE搜索广告的NLP&相关性、用户体验优化,包括并不限于: 1. 设计和优化搜索广告相关性下的Query理解、类目预测、深度语义相关性、商品理解、实体匹配等方向 2. 对比学习、表征学习、蒸馏学习在语义理解、类目预测、相关性判别等领域的应用和创新 3. 设计合理的全链路管控与供给策略,保证消费者体验、广告主投放效果、平台营收的良好平衡 4. LLM、MLLM在上述方向的全面应用与优化 5. 建立合理的相关性评测方法,进行数据挖掘,迭代数据标注任务,积累电商领域知识数据资产

更新于 2025-03-31