logo of bytedance

字节跳动模型评估专员-DMC

社招全职A217543地点:成都状态:招聘

任职要求


1、本科以上学历,有评测类项目运营经验,理解评测的业务逻辑,能负责一个评测项目的流程;
2、有与产品研发合作的经验或项目管理经验,具备多方协作的视角;
3、需要有大模型产品相关经验,对大模型训练有一定了解;做过Workflow或Agent
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责大语言模型在安全方向的安全和质量平衡,对安全队列产出的投训数据进行评估及质量把控;与产品、算法团队充分沟通协作,理解各方视角及数据质量要求,给到标注侧质量优化指导;
2、能独立负责专项送评沟通-评估追踪-分析结论输出全链路;承接基础业务的评估,具备评估业务逻辑,能够搭建评测集,设置评测指标,输出可置信的结论,并且能够按照业务需求,进行Workflow流程搭建;
3、能借助数据分析等方式对问题进行拆解分析,定位模型各类问题,例如安全、质量、体验等结合评估及用户视角提供解决思路及优化方向,输出有价值的分析报告。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of alibaba
社招5年以上数据类-商业数据

1、负责深度研究行业动态,分析市场供给状况,为业务决策提供数据支持和洞察。 2、设计并实施复杂的商业分析模型,评估业务策略对行业供给的影响,优化业务流程。 3、与各部门合作,收集、整合和解读数据,揭示业务机会和潜在风险。 4、定期生成报告,清晰呈现分析结果,协助团队理解和应对行业变化。 5、参与跨部门项目,推动数据驱动的决策制定,提升行业供给管理的效率和效果。

更新于 2025-08-25杭州
logo of sf
社招5-10年

岗位描述: 1、了解快递、供应链及海外物流业务的风控模式; 2、挖掘生态内部和外部数据,进行企业风险相关的数据分析; 3、结合业务策略进行风险政策优化,在兼顾客户感知的前提下控制好风险; 4、优化现有风控规则及模型,对资产质量,风险指标进行监控,对异常指标进行定位分析和解决; 5、结合市场、竞对情况,引入市场主流风控合作方,优化风控工具

更新于 2025-11-24深圳
logo of shein
社招5年以上商品平台类

1、负责对纺织品检测报告(色牢度、物理性能、化学项目)进行全流程审核,确保数据准确性、结论合规性及报告格式规范性。深入理解实验室测试原理及操作流程,验证报告与实验记录的匹配性; 2、依据公司质量判定标准,对不合格样品进行退供、复检或罚款,并跟踪处理结果; 3、负责对检测账单进行审核,确保检测费用准确无误; 4、通过检测数据多维分析(如不合格率趋势、项目耗时分布),识别系统性风险点,输出改进方案; 5、建立检测报告质量评估模型,协同IT部门开发自动化审核工具,提升审核效率与一致性。

更新于 2025-10-29广州
logo of sf
社招3-5年

1、负责航空运营端到端的管控,推动航空环节逾限、客诉的标准规则的应用与落地; 2、负责航空端到端运营成本管控、结算,推动SOP的应用与落地; 3、负责航空运营过程管理,含发提货异常环节的执行与落地; 4、负责散航年度预算及月度滚动预测的编制; 5、负责航空端到端风控管理,推动SOP的应用与落地。

更新于 2025-10-15乌鲁木齐