logo of bytedance

字节跳动数据科学家(LLM与无监督学习方向)-应用人工智能

社招全职3年以上A248541地点:上海状态:招聘

任职要求


1、本科及以上学历,计算机科学、数据科学、统计学等相关专业优先,具备扎实的统计学、机器学习数学基础,熟悉数据流水线搭建、模型开发、测试与部署全流程;
2、英语听说读写流利,能向技术与非技术受众清晰传达分析和技术内容,具备从业务需求出发定义数据项目的能力;
3、至少3年数据分析或模型开发经验,具备大语言模型(LLM)技术落地经验(如测试时扩展、思维链、检索增强生成、监督微调等),能在数据集上构建并验证预测模型;​
4、精通PythonSQL,熟练使用TensorFlow/PyTorch等ML/DL框架,掌握无监督学习、聚类算法及数据洞察提取,熟悉SQL/Hive/Spark大数据工具者优先;​
5、强烈的求知欲与量化分析能力,擅长拆解复杂问题、定位根本原因并提出解决方案,有CI/CD(如Git)或云服务(AWS/GCP/Azure)经验者优先;​
6、对数据驱动的业务增长有敏锐洞察,能将算法成果转化为用户价值与产品影响力,具备社区洞察或内容理解相关经验者优先。

工作职责


1、利用多模态大语言模型(LLM)、自然语言处理(NLP)、机器学习或计算机视觉技术,设计并构建核心产品能力,提取数据洞察,优化商业化策略;
2、运用前沿深度学习、机器学习、统计及优化技术,为业务问题开发创新算法并搭建原型;
3、通过无监督学习与聚类算法,从大规模数据集中挖掘潜在模式与趋势,提出数据驱动的业务解决方案;
4、与产品经理及跨职能团队协作,定义用户需求与成功指标,主导数据项目从0到1的全流程管理;
5、采用AB测试等方法验证项目商业价值与预期收益,持续优化模型性能;
6、与工程团队协作部署数据模型,推动解决方案的规模化落地。
包括英文材料
学历+
数据科学+
机器学习+
数据分析+
大模型+
Python+
SQL+
TensorFlow+
PyTorch+
算法+
Hive+
Spark+
大数据+
CI+
CD+
Git+
AWS+
Azure+
相关职位

logo of bytedance
社招3年以上A140274B

1、应用多模态大语言模型、自然语言处理和计算机视觉技术,设计和开发数据产品,提取洞察并优化业务策略; 2、利用最新的深度学习、机器学习、统计学和优化技术,开发创新的算法和原型,解决业务问题; 3、运用无监督学习和聚类算法,从大规模数据集中发现潜在的模式和趋势,提出数据驱动的业务解决方案; 4、与产品经理和跨职能团队合作,定义用户故事和成功指标,并管理从0到1的数据项目; 5、与工程团队合作,部署并扩展数据模型,确保顺利集成和性能优化。

更新于 2025-06-12
logo of bytedance
社招3年以上A56731A

1、应用多模态大语言模型、自然语言处理和计算机视觉技术,设计和开发数据产品,提取洞察并优化业务策略; 2、利用最新的深度学习、机器学习、统计学和优化技术,开发创新的算法和原型,解决业务问题; 3、运用无监督学习和聚类算法,从大规模数据集中发现潜在的模式和趋势,提出数据驱动的业务解决方案; 4、与产品经理和跨职能团队合作,定义用户故事和成功指标,并管理从0到1的数据项目; 5、与工程团队合作,部署并扩展数据模型,确保顺利集成和性能优化。

更新于 2025-06-12
logo of bytedance
社招3年以上A85833A

1、基于最新的大模型、深度学习、机器学习、统计学和优化技术,开发创新算法并为业务问题构建原型; 2、通过无监督学习、聚类算法等技术,从海量数据中发现潜在的模式和趋势,提出数据驱动的业务解决方案; 3、与产品经理和跨职能团队合作,定义用户故事和成功指标,管理数据项目从0到1的全过程; 4、使用AB测试等方法验证项目的商业价值和预期收益,并持续优化模型性能; 5、与工程团队合作部署数据模型,并将解决方案规模化。 1.Develop innovative algorithms and build prototypes for business problems using the latest deep learning, machine learning, statistical, and optimization techniques; 2.Use unsupervised learning and clustering algorithms to discover potential patterns and trends from large datasets and propose data-driven business solutions; 3.Collaborate with product managers and cross-functional teams to define user stories and success metrics, managing data projects from 0 to 1; 4.Use methods like AB testing to validate the business value and expected revenue of projects and continuously optimize model performance; 5.Work with engineering teams to deploy data models and scale solutions.

更新于 2025-03-03
logo of alibaba
实习阿里国际2026

Bravo 102是由阿里国际技术全团队共同发起的全球顶尖技术人才孵化计划,打破传统人才选拔及培养框架,为有志于走向AI未来的技术新锐们,提供“你行你上+我要我来”的双向奔赴式的实习机会选择。 在这里,“我”将不被岗位定义,以能力选择业务战场,与全球顶尖团队并肩作战,沉浸式体验全球多元化业务战场与亿级流量高并发系统。 加入我们,成为AIDC首批102位Bravo Talent,一起掌舵AI,为我们的未来Bravo! 关于我们: 我们希望利用 AI 技术让每个人都能够轻松、便捷地享受全球优质的商品和服务,推动商业活动更加高效、可持续,为社会未来的发展带来更多可能性。 数据团队立足中国、服务全球,每天处理覆盖东南亚、欧洲、美洲等多时区的跨境数据洪流,在多语言、多文化、多法规的复杂场景中,打造“数据&AI技术驱动业务”的全球化数据中台,打造亿级跨境数仓平台,攻克多时区同步与数据合规难题;运用 AI 模型优化流量分配与智能诊断,推动决策AI化转型;沉淀算法能力为 AI 产品,直达业务价值;保障双十一级洪峰响应,为全球消费者营造流畅的购物体验; 欢迎加入我们一起构建强大的数据中台和智能决策支持系统! 职位描述: 1、驱动阿里国际数字商业板块业务增长,构建 AIDC 100多个国家数据运营资产体系; 2、建设本地化市场洞察和机会发现能力,帮助业务全方位了解行业动态,挖掘商业机会; 3、承担设计和建立产品/业务的指标体系,能够科学地跟踪和指导业务的发展; 4、参与构建海外 ToB/ToC 电商用增、供应链&物流、商品等行业的数据智能化应用解决方案,驱动业务获得增量价值; 5、参与构建企业级 Data Agent,融合 LLM 与业务数据打造智能决策大脑;

更新于 2025-04-25