logo of bytedance

字节跳动大模型应用算法工程师-Data

社招全职A200446地点:北京状态:招聘

任职要求


1、有搜索相关经验,熟悉搜索的召回、粗排、精排算法;
2、熟悉常见的NLP相关算法,包括纠错、分词、改写、Term Weight、意图识别、相关性等;
3、有结构化信息提取、智能摘要经验者优先;
4、熟悉大模型相关技…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、支持火山方舟大模型的应用落地,将字节跳动的内容与大模型相结合,为用户提供更智能的信息服务;
2、探索最前沿的NLP技术,将深度学习模型应用到用户Query分析、Query改写等方向,充分理解用户;
3、利用NLP技术以及大模型技术,对内容进行分析、理解,完成内容打标、内容摘要等信息的生成和提取;
4、通过外挂知识库模式,在内容搜索领域不断探索,使用NLP、多模态技术进行高质量内容召回;
5、将大模型技术和Ranking技术结合,解决内容排序问题。
包括英文材料
算法+
NLP+
大模型+
SFT+
还有更多 •••
相关职位

logo of bytedance
校招A67478

团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法; 2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平。

更新于 2025-08-04深圳
logo of bytedance
校招A34031A

团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。

更新于 2025-08-04北京
logo of ke
社招3年以上图像技术组

1.负责贝壳多模态数据下的多模态大模型增量预训练、指令微调,以及面向下游垂直领域任务的效果优化; 2.结合自有产品和业务需求,负责跨模态检索、多模态分类、多模态表征等模型研发与应用,解决面向业务场景的应用和落地时的算法卡点问题; 3.负责搭建多模态大模型dataset和benchmark的收集、清洗和评测体系; 4.与工程、产品团队配合,推动团队成果的应用落地。

更新于 2025-02-24北京
logo of alibaba
社招2年以上技术类-数据

1,负责电商数据仓库的ETL流程设计、开发与优化,尤其关注招商、营销活动(含大促)等核心业务场景的数据集成,确保数据的准确性、实时性和为业务决策和AI应用提供高质量数据基础。 2,主导电商领域的数据建模工作,构建满足用户画像、商品分析、营销效果评估等业务需求的多维数据模型,支持精细化运营、个性化推荐和智能决策。 3,与电商业务、招商、营销业务和数据科学等组紧密合作,深入理解业务痛点和增长目标,提供创新的数据解决方案,优化数据处理流程,提升数据赋能业务的能力。 4,参与大数据平台的优化和扩展,探索并应用AI技术(如机器学习、自然语言处理等)提升数据处理效率、数据质量和数据洞察能力,例如智能数据清洗、异常检测、特征工程自动化等。 5,编写高质量的代码和技术文档,确保代码的可维护性、可扩展性和可理解性,并积极参与技术分享和知识沉淀。 1,Responsible for the design, development, and optimization of ETL processes for the e-commerce data warehouse, with a focus on core business scenarios such as merchant acquisition, marketing campaigns (including major promotions), ensuring accurate, real-time, and efficient data transmission, and providing high-quality data foundation for business decisions and AI applications. 2,Lead data modeling efforts in the e-commerce domain, building multi-dimensional data models that meet the business needs of user profiling, product analysis, marketing performance evaluation, etc., supporting refined operations, personalized recommendations, and intelligent decision-making. 3,Collaborate closely with e-commerce business, merchant acquisition, marketing, and other teams to deeply understand business pain points and growth objectives, provide innovative data solutions, optimize data processing workflows, and enhance the ability of data to empower business. 4,Participate in the optimization and expansion of big data platforms, explore and apply AI technologies (such as machine learning, natural language processing, etc.) to improve data processing efficiency, data quality, and data insight capabilities, such as intelligent data cleaning, anomaly detection, and automated feature engineering. 5,Produce high-quality code and technical documentation to ensure code maintainability, scalability, and understandability, and actively participate in technical sharing and knowledge accumulation.

更新于 2025-05-26杭州