字节跳动大语言模型算法开发工程师/专家(教育应用方向)-豆包大模型
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python; 2、熟悉NLP相关的算法和技术,在相关领域有过良好研究记录者优先,熟悉大模型预训练、SFT与RL算法者优先; …
工作职责
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、擅长发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、探索多轮对话场景下复杂指令遵循与模型在长文本下的推理能力; 3、推进数据建设、指令微调、偏好对齐、模型优化方面的工作,提高模型质量和适应性; 4、推进教育领域大模型效果评估,尤其是复杂场景(多轮对话、多模态)评估集建设和自动化评估能力建设; 5、基于教育领域应用优化模型效果,包括AI导师、解题、讲题、批改等场景; 6、深入研究和探索大模型在教育领域中的更多使用场景,拓展模型的应用范围。
我们正在寻找一位对数据充满热情、具备出色分析能力的财资BI分析师。该职位将深入了解 BU 业务模式,研究核心BU庞大的财资业务数据(包括但不限于现金流、银行账户、外汇、融资、支付结算、风险敞口等),通过先进的数据分析和可视化技术,提炼有价值的业务洞察 (Insights)。该职位将负责设计、开发和维护关键的财资管理报表和仪表盘,主动识别潜在风险、发现运营效率提升的机会点,并为财资战略决策提供强有力的数据支持,助力业务集团财资管理水平的持续优化和价值创造。 主要职责: 1. 数据治理与整合: ● 负责财资管理领域数据质量监控、标准制定及清洗整合,确保数据准确性与一致性。 ● 构建财资数据库,支持本领域同学高效获取结构化数据。 2. 报表开发与可视化: ● 使用BI或DI工具设计、开发和上线可视化报表与驾驶舱,涵盖全球现金头寸、资金预测偏差分析、风险敞口监控(汇率、利率等)、银行费用分析、营运资本指标、关键绩效指标(KPIs)等,满足管理层及财资端需求。 ● 定期输出财资管理报告、风险预警报告等关键文档。 3. 数据分析洞察与风险预警: ● 对现金流模式进行深入分析,识别季节性、趋势性特征,评估预测准确性,挖掘偏差原因,提出预测改进建议。 ● 分析全球资金分布和使用效率,识别闲置资金,评估资金池效益,为优化账户结构和资金归集策略提供数据支持。 ● 量化和监控汇率、利率等市场风险敞口,评估对冲策略的有效性,识别潜在风险点。 ● 分析银行手续费、账户管理费等银行费用,识别成本节约机会。 ● 监控支付结算数据,识别异常交易模式,提示潜在的操作风险或欺诈风险。 ● 基于数据分析结果,建立或优化风险预警指标和机制,提前识别潜在的流动性风险、市场风险或操作风险信号。 ● 通过数据挖掘,主动发现可提升财资运营效率、降低成本、改善营运资本或优化融资结构的机会点。 ● 探索大语言模型(LLM)在财资管理数据分析中的创新应用。 4. 支持与协作: ● 与财资团队内部成员(现金管理、市场风险管理、财资运营等)、财务会计、产品技术、业务部门等紧密协作,理解业务需求,提供数据支持。 ● 协助进行财资相关的特定项目分析和情景模拟(Scenario Analysis)。 ● 参与财资管理系统或BI或DI工具的优化与升级项目。 ● 支持财资管理场景的AI Agent工具运用,实现数据查询、报告生成等流程自动化。
1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;
1. 研发高性能推理算法: 设计并实现自注意力机制优化、并行推理、负载均衡、弹性容量等无损推理服务优化算法,提升服务效率与稳定性; 2. 探索轻量化推理技术: 深入研究和应用有损推理加速算法,包括但不限于知识蒸馏、模型量化、网络剪枝、KV-Cache压缩等,实现模型的高效部署; 3. 聚焦软硬件一体优化策略: 从计算图优化、算子融合、计算通信重叠、专家并行、vGPU虚拟化等多个维度入手,显著提升端到端推理性能。
1,算法开发与优化: 负责自动驾驶模型算法的研发设计,包括但不限于行为决策、轨迹生成、运动规划等模块的深度学习/强化学习模型设计 探索基于Transformer、模仿学习(Imitation Learning)、强化学习(RL)等前沿技术的模型算法设计、应用方案 优化自动驾驶算法的实时性、安全性和舒适性,解决复杂场景(如拥堵、交互博弈、长尾问题)下的规划挑战 2,数据驱动迭代: 构建和利用大规模驾驶数据集(仿真+真实数据),设计数据闭环 pipeline 提升规划性能 参与数据标注、场景挖掘、仿真测试等环节,推动算法迭代 3,系统集成与部署: 与感知、控制等模块团队协作,实现模型算法在车载计算平台的部署 支持实车测试,分析问题并提出改进方案。 4,前沿技术跟踪: 跟进学术界(如CVPR、ICRA、CoRL)和工业界最新进展,将创新技术落地到量产或研发项目中