夸克千问事业部-数据挖掘工程师-北京
任职要求
1. 教育背景: 计算机、数学、统计学或相关专业本科及以上学历。 2. 经验要求: 具有3年以上相关工作经验,有大型互联网公司数据科学或算法工程经验者优先。 有广告系统、DMP平台落地经验者优先。 3. 算法能力: 熟悉常用的机器学习算法(LR, GBDT, XGBoost, RF等)及深度学习框架,有图算法(Label Propagation、Connected Components、GraphSAGE等)工程实践经验者优先。 4. 工程能力: 编码能力强,能熟练应用SQL,掌握Java/Scala/Python其中至少一种语言。熟悉大数据生态(Spark/Hadoop/Hive),熟悉及掌握阿里云DataWorks/M…
工作职责
团队介绍:数据技术团队负责构建覆盖数据采集、治理到分析赋能的全链路数据能力体系,为广告投放策略优化与内容业务增长提供核心数据支撑。 1. ID-Mapping体系构建与优化: 负责设计并搭建公司级ID-Mapping架构,利用图计算、概率统计模型等技术,持续提升ID-Mapping数据的准确率与覆盖率。 2. 用户画像与标签体系建设: 负责用户标签体系的规划与开发,包括基础属性标签、行为统计标签及算法预测标签。挖掘高价值特征,利用机器学习/深度学习模型优化标签生产的精准度,推动标签在业务场景下的有效应用与反馈闭环。 3. 算法落地与工程化实现: 负责相关算法模型的大规模工程化落地,优化离线/实时计算任务的性能,确保ID-Mapping、画像数据的产出时效性(支持T+1及准实时)。
团队介绍: 1. 夸克搜索是追求极速智能搜索的先行者,为用户的信息获取提供极速精准的搜索体验。 2. 团队属于阿里巴巴智能信息事业部板块下核心技术部门,负责夸克搜索业务核心体验的优化与开发。 3. 团队内部算法和工程结合,可以依据个人兴趣和能力,深入探索更丰富的技术领域;同时团队氛围融洽且开放,追求简单、轻松、愉快工作氛围的同学不容错过。 4. 团队工作具有业务复杂度高、技术挑战大、技术栈全面等特点,高并发低延时,大数据存储及挖掘。 5. 团队紧跟业界前沿技术,演进和迭代业务架构和算法,支撑业务在行业竞争中处于优势地位。 1. 该岗位主要负责垂直行业的业务开发,包括在线召回、排序系统效果优化,离线系统分析、设计,行业质量相关数据体系建设,能主导完成业务优化上下游的详细方案设计和编码开发,确保项目的进度和质量; 2. 该职位需要理解业务,识别业务需求,主导业务技术难题攻关,结合当前业界先进的方案,推进业务效果的持续迭代;

1. 负责超级汇川平台及UC信息流B端业务设计和研发工作。 2. 负责通过业务逻辑及AI能力的结合建设旨在提高B端用户生产效率的工具。 3. 负责通过数据驱动、数据挖掘发现问题并驱动业务流程优化提效。 4. 新技术调研引入及基础设施的建设和搭建。
- 负责输入法核心算法的研发与优化,包括但不限于语言模型(LM)、解码搜索算法、拼写纠错、分词及词性标注等模块。 - 深入研究并落地大语言模型(LLM)在输入法场景的应用,如智能预测、上下文联想、文本润色及个性化生成等。 - 优化输入法的端侧模型,在保证预测准确率的同时,实现模型在移动设备上的轻量化部署与高效推理。 - 负责用户行为数据的挖掘与分析,通过用户画像和个性化算法,提升用户的打字效率与输入体验。 - 跟进学术界与工业界的前沿技术(如NLP、深度学习、推荐系统等),并推动其在输入法产品中的落地。