快手数据挖掘算法工程师 -【可灵AI】
任职要求
1、硕士及以上学历,数学、统计、计算机、人工智能等相关专业优先; 2、熟悉统计模型、机器学习、深度学习、自然语言处理等技术,掌握数据挖掘核心技术例如特征工程、聚类分析、异常检测、关联规则挖掘等; 3、具有优秀的编程基础,熟练掌握Python或Ja…
工作职责
1、负责海量多模态数据(视频、图片、音频等)的采集、清洗、去燥、标注与增强,构建高置信度训练数据集,支撑大模型训练与优化; 2、构建领域数据集,优化数据分布与质量,解决数据稀疏性、偏差性等问题; 3、分析模型训练中的数据瓶颈,提出改进方案。
负责可灵AI的多源数据,线上用户反馈数据采集,挖掘和分析。通过数据挖掘、统计分析和可视化工具,完善可灵AI数据闭环链路,为可灵AI的数据侧提供战略决策和业务优化提供数据支持。 1、数据pipeline构建:负责视频生成大模型的训练数据构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型的持续迭代; 2、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供数据分布的可视化报告及改进建议,确保模型训练数据覆盖目标场景和多样性需求; 3、用户数据分析:分析用户交互数据,评估视频生成效果与用户满意度,提取用户反馈中的数据优化方向。构建用户行为分析模型,探索用户需求变化并为模型优化提供参考; 4、优化模型生成效果:构建数据飞轮。通过数据驱动的方法优化视频生成大模型效果,结合A/B测试等手段验证调整效果。与算法工程师合作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力。
1、作为产品解决方案架构师,深入理解灵骏及异构产品所负责的高性能AI智算集群的技术原理、架构和使用场景,能够根据企业级客户需求和产品能力,规划设计合理的灵骏产品解决方案,推动和实现产品的商业化落地。 2、具备良好的架构思维能力,能够从稳定性、高性能、易用性、可用性、可运维性等方面综合考虑,结合云计算平台产品特点,敏锐捕捉市场趋势,分析竞对产品及市场策略,为产品的设计、实现、改进不断提出建设性的想法和建议,反哺产品能力建设,不断提升灵骏及异构产品的市场竞争力和市场份额。 3、与前线架构师/BTE销售紧密合作,主动了解客户当前在产品方案遇到的困难和需求,帮助客户解决技术问题,寻找新的业务突破点。推广产品方案并能够影响客户的基础设施、工程、算法等不同团队,用产品技术推动业务扩展。 4、分析云计算技术发展趋势/市场竟争格局,挖掘行业数据/客户商机,建立可复制行业解决方案,与产品内部的产品经理、资源及经营团队、研发等团队紧密配合,推动营收增长。
1、数据pipeline建设:负责视频生成大模型的训练数据构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型的持续迭代; 2、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供数据分布的可视化报告及改进建议,确保模型训练数据覆盖目标场景和多样性需求; 3、用户数据分析:分析用户交互数据,评估视频生成效果与用户满意度,提取用户反馈中的数据优化方向。构建用户行为分析模型,探索用户需求变化并为模型优化提供参考; 4、优化模型生成效果:构建数据飞轮。通过数据驱动的方法优化视频生成大模型效果,结合A/B测试等手段验证调整效果。与算法工程师合作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力。
1、负责可灵AI数据侧从模型效果出发,对各种数据源中收集、处理和分析数据,以提取有价值的信息、洞察力和趋势,以支持数据驱动的决策过程; -模型分析和评测:分析数据对模型带来的效果,通过多角度的数据分析验证数据的模型下效果; -评测能力建设和结果呈现:建设系统化的数据分析的平台和工具,完善AI模型分析的链路和机制;按时按量输出高质量的数据分析和反馈报告,支撑数据决策; -质量改进和文档管理: 参与需求评审和设计评审,提前发现潜在问题,提供质量改进建议;编写和维护分析相关文档,如分析报告、模型说明等。 2、负责可灵AI数据平台的质量保证工作,确保平台的功能、性能和稳定性达到预期标准。通过测试计划制定、执行和优化,提升平台的整体质量和用户体验; -测试计划与设计:根据AI数据平台的需求和技术文档,制定详细的测试计划和测试用例;设计功能测试、性能测试、兼容性测试等多种测试方案; -测试执行和缺陷管理:设计数据平台侧通用测试用例,设计并执行自动化的手动测试和自动化测试,确保平台功能符合预期;发现并报告平台及相关软件的缺陷,跟踪问题的修复进度; -质量改进和文档管理:参与需求评审和设计评审,提前发现潜在问题;提供质量改进建议,优化测试流程和工具;编写和维护测试相关文档,如测试计划、测试报告等。