logo of bytedance

字节跳动开源大数据引擎资深专家 - EMR/大数据云平台

社招全职3年以上A35623地点:北京状态:招聘

任职要求


1、计算机相关专业,3年以上大数据或数据库内核研发经验;
2、熟练使用 C/C++/Java/Rust 一种或多种编程语言;
3、熟悉开源大数据开源生态组件或同类商业化的分析型数据库;
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与字节跳动EMR 开源大数据内核研发,打造极速数据分析新范式;
2、深度参与相关开源社区,助力大数据产品提升开源影响力;
3、协助客户处理生产业务中的海量数据,解决疑难问题,发挥数据价值;
4、构建EMR大数据引擎技术竞争力,打造业界领先的引擎生态平台。
包括英文材料
大数据+
内核+
C+
C+++
Java+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A96870A

1、负责Data+AI方向的ToB产品的演进规划、竞争力建设和研发,打造业内领先的产品; 2、负责计算和存储引擎内核的深度优化,领先开源社区和行业,给客户提供增量价值; 3、负责大模型数据处理框架的研发、数据处理算子的研发,引领市场需求; 4、与火山引擎方舟、机器学习平台等产品深度生态对接,打造AI全链路组合竞争力; 5、支撑客户的预训练、后训练、模型蒸馏、AI搜索、RAG、Agent等场景的数据需求。

更新于 2025-03-10上海
logo of antgroup
社招3年以上技术类-算法

我们致力于打造银行信贷领域的新一代“智能决策大脑”。我们以行业与产业研究为锚点,以数据智能为引擎,深度融合资深信贷专家的经验与海量异构数据洞察,构建面向信贷全生命周期的领域专属决策大模型。 1.主导信贷大模型的后训练体系:通过有监督微调(SFT)、奖励模型(RM)训练、人类反馈强化学习(RLHF)、直接偏好优化(DPO)等领域领先技术,让模型不仅“会回答”,更能“可解释、答得准、判得稳、符合专家直觉”,实现与信贷业务目标的深度对齐。 2.构建垂直领域智能Agent系统的能力:能主导信贷场景下Intelligent Agent的核心框架设计,融合感知、规划、执行与持续学习机制,并通过知识图谱、RAG、NL2SQL等技术打通非结构化知识、结构化数据与自然语言交互,实现从行业洞察、风险画像到决策支持的端到端自动化。 3.打造高质量领域数据飞轮:从零构建面向信贷场景的指令与偏好数据集,设计数据配比、清洗、增强与合成策略,持续提升数据效率与泛化能力——因为你知道,好模型的背后,是更聪明的数据。 4.建立科学严谨的评估体系:构建覆盖准确性、逻辑一致性、风险敏感度、幻觉控制等多维度的自动化评测 pipeline,用数据驱动模型迭代,确保每一个版本都比上一个更可靠、更可用。 5.站在AI+金融的最前沿:紧密跟踪全球大模型的最新进展(如新型偏好学习、多Agent协作等),快速将学术突破转化为业务生产力,解决真实世界中复杂、高 stakes 的信贷决策挑战。同时将领域化的研究转化为高质量的顶会论文,形成持续学术影响力。

更新于 2025-11-13上海|杭州
logo of xiaohongshu
社招5-10年后端开发

【关于我们】 点点是小红书新一代生活场景AI搜索助手,依托DeepSeek大模型 + 小红书海量真实笔记 + 全网经验,为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,已形成独立App、微信小程序 + 小红书站内“问点点”全域布局。 “用增方向”(用户增长)是点点的核心战略引擎,当前重点通过外部流量平台投放(抖音、快手、B站、微博、小红书生态外渠道、搜索广告等)驱动新用户获取、激活与留存,实现DAU快速规模化增长。我们正在构建高效的投放增长闭环:从创意素材生成、投放策略优化、实时效果监控,到用户全链路转化漏斗优化,推动点点成为年轻人日常必备的“生活搜索神器”。 我们期待对内外部流量投放增长有深度实战、对AI产品冷启动与规模化增长敏感、对数据驱动决策有极致追求的资深后端同学,一起把点点从“有用”做到“让人上瘾、规模爆发”! 【岗位职责】 1、负责点点内外部流量投放增长系统的核心架构设计与开发,包括投放数据实时采集、策略引擎、预算分配、创意分发、A/B实验平台、转化归因链路等; 2、构建高并发、低延迟的投放决策与监控服务,支持日均亿级曝光、千万级点击的实时个性化投放与动态调优; 3、设计并实现跨平台投放统一中台,打通抖音、快手、B站、微博、搜索广告(百度/字节/腾讯系)等多渠道数据与投放接口,实现统一调度、预算智能分配、ROI实时优化; 4、建设增长实验平台与效果分析体系,支持快速测试投放创意、落地页、渠道策略、用户分层等,驱动新用户获取成本持续下降、激活/留存率显著提升; 5、与算法(推荐/召回/创意生成)、客户端、数据、运营团队深度协作,推动外部流量 → App/小程序激活 → 多轮交互 → 留存的闭环增长; 6、优化系统性能、稳定性与成本控制,支撑高峰期QPS与低延迟,确保投放链路99.99%可用性; 7、参与增长基础设施建设(如实时特征平台、埋点治理、归因模型、反作弊体系等),赋能投放增长效率翻倍。

更新于 2026-01-15上海|北京
logo of bytedance
社招3年以上Y3055

1、负责面向客户建设有市场竞争力的大数据开发治理套件、EMR、LAS等大数据平台类产品,丰富火山引擎数据中台产品矩阵,洞察行业的机会点,持续挖掘产品的商业化潜力; 2、能够抽象各行业客户需求,并将需求转化为高品质的产品设计或解决方案; 3、与商业化销售/解决方案配合,对外部客户进行产品推介和宣讲; 4、制定产品的GTM策略和定价,保障产品在行业中的竞争力。

更新于 2022-05-13北京