字节跳动高级算法工程师(多模态方向)-业务中台
任职要求
1、优秀的编程和算法能力,熟悉Python/C++编程语言,掌握深度学习基础知识,熟悉Pytorch、Tensorflow等至少一种深度学习框架; 2、熟悉Transformer等深度学习算法,有一定的多模态相关背景,较强的算法实现能力,熟悉多模态常用算法; 3、具备深度预训练模型经验者优先;有多模态、NLP、CV、视频/音频算法相关领域经验者优先;对LLM、多模…
工作职责
1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求。
1、与业务方紧密合作,理清业务需求并从多模态角度提供解决方案; 2、跟进前沿多模态算法,了解常见多模态任务、数据、评测手段,能够使用内外部多模态工具; 3、处理和分析多模态数据,需要能够有效地清洗、整理和可视化数据等; 4、在多模态LLM上要做到用能改,并在业务数据上Finetune; 5、着重探索基于多模态LLM的视频内容理解,支撑各类业务; 6、与各团队紧密协作,确保算法实施满足业务需求,有优秀的团队管理经验。
1.拟人SFT数据构建与策略设计 (1)负责面向超拟人语音交互场景的SFT数据方案设计,涵盖角色人设一致性、多轮对话逻辑、情感表达等维度,构建高质量对话语料。 (2)针对多模态交互、A陪伴等需求,设计角色扮演数据的标注规范,包括身份背景、经典台词、行为模式等细粒度标签。 (3)基于业务场景(如儿童教育、情感陪伴、游戏NPC、模拟面试等)设计符合角色设定的对话逻辑,提升用户交互沉浸感。 (4)建立SFT数据评估体系,针对人设一致性、意图识别准确率、对话流畅度等指标进行量化分析与迭代。 2.SFT数据在语音交互模型中的优化 (1)结合语音交互链路(ASR→LLM→TTS),通过SFT技术优化大模型的对话能力,重点提升上下文理解、情感响应准确度及多轮对话连贯性。 (2)探索角色扮演数据在语音Agent中的应用,例如通过Prompt工程控制对话风格、情绪倾向,实现个性化交互体验。 (3)协同声纹识别、情感计算等技术,构建语音-文本-用户画像对齐的数据集,支持个性化交互(如儿童声线识别、成人情感分析)。 (4)推动SFT数据在低延迟语音交互场景的落地,优化端到端响应效率(如实时打断、长上下文记忆等能力)。
高级/资深算法工程师(国际支付风控方向),base上海/南京 1.支付风险识别与防控 ●负责跨境电商业务中支付风险的全面识别与防控,重点治理欺诈(盗卡、盗账户 友好欺诈)等方面风险,确保支付全链路安全可靠。 ●利用数据分析和机器学习技术,精确识别支付风险,建立有效的风控模型体系。 2.风控模型全链路管理 ●主导支付风控模型的全链路开发与上线工作,包括需求调研、风险探索、方案设计、模型开发、系统集成、部署上线、效果评估、持续优化和监控预警。 ●与产品、工程、业务团队紧密合作,确保风控模型精准全面覆盖业务场景,并能够及时应对市场变化。 3.前沿技术应用与创新 ●深入探索全球各大市场的新型支付作弊行为,利用多模态大数据进行风险评估与预测。 ●应用异常检测、集成学习、强化学习、序列模型、图模型、大规模预训练模型等前沿技术,提升风险识别的准确率和召回率。
负责智能客户运营等多个产品的算法研发与落地,机器学习建模、前沿技术追踪、大语言模型Large Language Model (LLM) 技术在各垂类业务场景落地的核心技术攻坚等。 比如智能运营助手、营销答疑助手、营销Agentic Workflows构建等场景的大模型落地,提升内外部用户的服务效率和用户体验。 职位描述: ‒ 负责基于通用基座大模型结合领域数据构建营销服务领域大模型,包括但不限于如下场景的营销LLM关键技术攻坚: 1. 大模型落地业务场景识别 2. 垂域数据清洗 / 构造 3. 垂域LLM的后训练 4. 搜索增强RAG 5. LLM Agents 6. LLM推理加速 ‒ 探索基于大模型技术的营销场景服务新形态,包括多场景下的大模型对话机器人、智能辅助Copilot、Agentic Workflow大模型在实际业务场景中的落地,打造营销领域的AI Agent标杆。