
同花顺AIGC算法-数据方向
任职要求
1. 计算机、数学或相关专业硕士及以上学历;拥有1年以上大模型数据工程领域工作经验,对技术创新充满热情。 2. 深入理解 RLHF 技术路径,具备多模态数据(文本、图像、代码)构建的丰富实战经验;精通 Hugging Face、Label Studio 等前沿工具,熟悉 PyTorch、TensorFlow 框架,能够快速上手并推动项目落地。 3. 掌握 Ray、Kubernetes 等分布式数据处理技术,具备数据生成流水线优化经验,能够独立设计并实现高效的数据平台架构。 4. 加分项:对逻辑推理和形式化验证有深入研究的候选人优先,我们期待你带来全新的思路与突破。
工作职责
1.设计并构建多模态数据评估体系,精准量化数据对大模型性能的影响,为数据生成策略的持续迭代提供有力支持,推动模型不断进化。 2.探索无监督与半监督数据生成技术,突破传统人工标注限制,打造低成本、高多样性的数据解决方案,为前沿算法研发注入源源不断的数据动力。 3.与顶尖算法工程师团队紧密协作,深度参与深度学习模型的研发全流程,设计并实现契合业务需求的高效数据解决方案,共同打造行业领先的大模型产品。 4.持续提升平台数据生产效率与易用性,降低算法开发门槛;积极探索并转化业界前沿的多模态数据处理技术,将创新成果落地为多场景业务应用,助力企业数字化转型。
-负责基于路采的图像及点云数据的室外/城市等场景的高质量的三维重建 -负责NeRF/3DGS及相关AIGC算法在城市自动驾驶场景的研究和应用落地,实现自动驾驶闭环仿真 -利用上述算法对自动驾驶数据进行场景泛化及数据合成,包括但不限于:新视角数据生成、障碍物轨迹改变、插入虚拟物体等 -负责算法迭代和优化,提升算法的渲染质量和性能
1、负责国际电商AIGC能力(如文本、图像、视频生成)的后台系统架构设计与开发,支撑多场景AI应用服务; 2、负责提升视频素材生产能力,分析并复刻流行创意,进行创意洞察,建设优质素材库,结合Gen AI多模态数据生成,数据驱动优化视频投放的各个环节; 3、深度参与到AI Agent框架和应用研究、工程研发和产品设计等重要环节,与产品、设计等团队合作推动AI Agent产品落地; 4、通过调研和应用前沿的技术架构和先进实践,结合场景建设的研发基础设施,推动国际电商的AI产品快速发展。

LLM Rerank方向*2 (1)支撑AI搜索产品算法效果&能力升级,支撑搜索+LLM产品的落地; (2)结合大模型提升重排、相关性和召回效果,提升搜索增强(RAG)、搜索业务的多维度相关性; (3)针对业务问题进行有效的问题拆解,组织工程、架构、数据方向解决问题; (4)参与和支撑LLM与搜索结合的相关项目,如:AI搜索、智能摘要、AIGC等。 综合数据质量*1 (1)支撑AI搜索产品算法效果&能力升级,支撑搜索+LLM产品的落地; (2)负责综合质量分模型、基于MLLM、LLM等模型搭建成熟的数据质量能力,提升搜索增强(RAG)、搜索业务的结果质量; (3)与工程、架构合作搭建成熟的离线特征计算、内容理解链路。 爬虫算法*1 (1)支撑AI搜索产品算法效果&能力升级,支撑搜索+LLM产品的落地; (2)负责爬虫相关算法、通过建设新链发现、链接选取、爬虫调度等算法提升数据的获取效率、时效等,提升搜索增强(RAG)、搜索业务的结果全面性和实时性; (3)与爬虫合作搭建成熟的爬虫平台、提升业务支撑能力; (4)支撑智能AI爬虫项目的算法能力建设,包括:web agent、智能爬虫插件等。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、负责AIGC应用相关的低成本微调、小样本训练; 2、负责Prompt的迭代调优,设计平台化方式并完成产品需求转化,结合实际业务需求完成Promt的模板创作; 3、在相关应用在电商场景落地,包括语料标注、内容创作&优化、逻辑推理、智能对话等; 4、在电商的更多使用场景的深入研究和探索。