logo of 01ai

零一万物知识算法工程师

社招全职3年以上算法地点:北京状态:招聘

任职要求


1. 计算机、人工智能、软件工程、数学或相关专业本科及以上学历,3年以上算法或AI工程经验; 
2. 熟练掌握Python及主流深度学习框架(PyTorch/TensorFlow),具备扎实的算法实现与调试能力; 
3. 在以下至少两个方向有深入实践: 
 - OCR后处理与文本数据清洗(如模糊匹配、规则引擎、语言模型纠错); 
 - 知识图谱构建(使用Neo4j、Apache Jena、DGL-KE等工具链); 
 - 大模型微调与部署(熟悉HuggingFace Transformers、vLLM、L…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大规模OCR识别结果的数据清洗、纠错与结构化处理,提升文本抽取的准确率与可用性; 
2. 设计并构建面向垂直领域的知识图谱,包括实体识别、关系抽取、属性融合、图谱对齐等核心环节; 
3. 基于业务场景对开源或自研大语言模型(LLM)进行领域适配与高效微调(如LoRA、QLoRA、Prompt Tuning等),提升模型在特定任务(如问答、推理、信息补全)上的表现; 
4. 运用本体论(Ontology)方法设计领域知识体系,定义概念层级、语义关系与逻辑约束,支撑高质量知识建模与推理; 
5. 探索多模态(图像+文本)信息融合策略,将OCR输出与视觉上下文结合,增强知识抽取与语义理解能力; 
6. 与产品、数据及工程团队紧密协作,推动知识驱动型AI系统在内容理解、智能检索、风险识别等场景中的落地。
包括英文材料
学历+
算法+
Python+
深度学习+
PyTorch+
TensorFlow+
OCR+
还有更多 •••
相关职位

logo of momenta
校招软件工程

1. 设计并实现端到端智驾大模型,整合感知、规划与决策功能,提升模型的整体性能与效率; 2. 运用深度学习、强化学习、机器学习等技术,优化模型结构,提高模型对复杂驾驶场景的理解和应对能力; 3. 负责收集、标注和处理自动驾驶相关数据,构建高质量的数据集,为模型训练提供有力支持; 4. 利用数据增强、迁移学习等方法,提升数据利用效率,优化模型的泛化能力; 5. 跟踪自动驾驶和人工智能领域的最新研究成果,探索新技术在端到端大模型中的应用可能性。

更新于 2025-08-06北京|苏州|上海
logo of momenta
社招

1. 设计并实现端到端大模型,整合感知、规划与决策功能,提升模型的整体性能与效率; 2. 运用深度学习、强化学习、机器学习等技术,优化模型结构,提高模型对复杂驾驶场景的理解和应对能力; 3. 负责收集、标注和处理智能辅助驾驶相关数据,构建高质量的数据集,为模型训练提供有力支持; 4. 利用数据增强、迁移学习等方法,提升数据利用效率,优化模型的泛化能力; 5. 跟踪智能辅助驾驶和人工智能领域的最新研究成果,探索新技术在端到端大模型中的应用可能性

更新于 2025-11-17北京|上海|苏州
logo of baidu
社招ACG

-跟进前沿技术,参与目标检测/实例分割/视频理解/AIGC生成/多模态大模型等方向的算法技术研究与部署落地 -针对工业场景中的实际需求,协助参与CV算法的优化与迭代,提升算法性能与效果 -协助完成相关算法的工程化实现,完成算法落地与产品化工作,确保算法能够在实际项目中稳定运行 -跟踪行业动态与最新技术进展,赋能各个业务方向,为公司项目提供技术支持与解决方案

更新于 2024-09-03北京|上海
logo of bytedance
社招A166820

团队介绍:飞书是 AI 时代先进生产力平台,提供一站式工作协同、组织管理、业务提效工具和深入企业场景的 AI 能力,助力企业能增长,有巧降。 从互联网、高科技、消费零售,到制造、金融、医疗健康等,各行各业先进企业都在选择飞书,与飞书共创行业最佳实践。先进团队,先用飞书。 课题背景: 飞书沉淀了企业内大量知识(文档、wiki、消息、会议记录、图片、视频等)。随着企业知识图谱、用户行为轨迹等图结构数据规模的指数级增长,传统基于文本匹配的RAG系统面临关系感知缺失和个性化能力不足的矛盾。如何寻找相对开销低、效果好的企业问答RAG新范式,突破现有系统在跨模态意图理解深度、个性化排序精度与实时生成质量上的瓶颈,基于企业内部知识和外部公网知识来回答问题与完成深度创作,这项工作对于字节自身做好企业知识管理,和飞书打造国内领先的企业知识问答创作产品,都有重要意义。 课题挑战: 1、图结构融合挑战:传统RAG系统以文本匹配为核心,难以有效捕获用户行为模式、实体拓扑关系等非结构化图信息。如何将文本、图像、视频等异构图数据嵌入到语义理解框架中,构建统一的特征表示空间,是提升意图识别精度的关键瓶颈; 2、动态推理挑战:企业关系图谱具有实时演化特性,用户行为模式与实体关联强度随时间动态变化。现有静态图嵌入方法难以满足实时问答场景的时效性要求,需要开发增量式图学习算法实现动态知识更新; 3、企业内部知识和外部公网知识的融合:当两种知识之间存在差异或冲突时,如果无法有效融合,会显著降低回答的可靠性和实用性。如何在不同模态间建立准确的语义关联,并有效融合内外部知识,是提升回答可靠性和实用性的关键。虽然业界 Deep Research 实现了基于 Agent 架构的公网知识深度检索与创作,但尚无企业内外部知识融合的成功实践; 4、Agentic RAG 可控性:基于Agent架构来实现企业知识问答创作,依赖LLM进行自主推理和判断,其决策过程存在一定的不可预测性。在某些复杂情况下(召回语料量大且干扰性强、企业内部知识与外部知识冲突),Agent可能做出不符合预期的决策,且难以直接干预和纠正。 我们的优势: 1、飞书企业问答产品已经积累了一定的用户基础,并在快速增长; 2、依托飞书套件,能够建立比较完整的用户与其他飞书内实体的图结构数据,并且已经有过早期实践(Lark Graph); 3、飞书企业问答有完整的评测体系和资源,帮助RAG类探索快速迭代。

更新于 2025-05-28深圳