夸克千问C端事业群-多模态交互算法专家-杭州
社招全职3年以上技术类-算法地点:杭州状态:招聘
任职要求
1.硕士及以上学历,计算机科学、人工智能、自动化、人机交互、信号处理等相关专业,具备扎实的人工智能、自然语言处理与计算机视觉理论基础; 2.有3年以上多模态算法预研或工程落地经验,有多模态意图识别、任…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责全模态交互系统的算法研发,包括但不限于多模态意图理解、上下文感知、复杂任务分解、GUI理解、工具调用等功能的实现; 2.设计先进的全模态融合与推理算法,确保系统在各类真实场景中的鲁棒性与响应效率; 3.跟踪全模态大模型发展趋势,包括SFT、RL、多模态对齐等技术,探索前沿技术在产品中的落地应用。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
还有更多 •••
相关职位
社招2年以上技术类-算法
1. 负责研发语音端到端、语音Agent、多模态交互、语音实时同传等任务的基础研究和应用落地; 2. 负责研究语音生成与理解一体化模型架构、强化学习、统一的语音表征等技术方向; 3. 跟踪并研究实现业内顶尖成果,结合业务场景实现算法的工程化部署。
更新于 2025-12-26北京|杭州|上海
社招3年以上技术类-算法
千问学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 1. 负责面向场景的多模态大模型研发,包括图文、视频、音频等多个模态的预训练,探索多模态的数据质量评估和清洗方法; 2. 负责对模型的训练数据、训练策略、模型结构等进行深入分析,指导评测方式迭代以及模型训练策略优化; 3. 负责视觉深度推理、数字化理解、实时语音交互对话、视频生成等能力建设; 4. 负责跟踪和研究多模态大模型前沿技术调研、落地、对业务进行优化; 5. 负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
更新于 2026-02-03北京
社招3年以上技术类-算法
通过强化学习提升万亿级参数大模型的决策认知能力,实现大模型在复杂环境下的多模态交互,完成多轮感知-决策闭环,在前沿实践中推动AGI落地; 研发新一代大模型强化学习算法,提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力; 改进大规模分布式强化学习框架,优化万卡集群下的高效分布式训练效率,支持大模型与复杂环境/工具的高效交互; 将强化学习研究成果融入千问&夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。
更新于 2026-02-03北京|杭州