
智能互联智能互联-结构设计专家-深圳/杭州/上海
任职要求
1.5年以上消费类电子结构工作经验、熟悉产品架构设计、结构设计;熟悉消费类电子产品的可靠性测试标准 2.机电、模具、工业设计等相关专业,本科及以上学历。精通机器人运动学、动力学与控制的基本理论,熟悉机械设计理论理论与分析方法 3.熟悉各类模具结构:包括五金、压铸、塑料和油压模具等。熟悉塑料模具成型工艺,冲压工艺等 4.精通PROE软件3D制图,CA…
工作职责
1.负责产品的结构设计,关键器件选型以及关键问题的内外部门拉通 2.负责产品设计评审、模具DFM评审、模具结构评审,以及试模检讨相关工作 3.负责产品开发过程中产线生产技术支持,包括检治具辅助设计以及生产工艺自动化等 4.负责产品开发过程的质量管控,开发各阶段测试计划制定以及产品测试验证,Debug工作等 5.负责结构产品规格制定,产品结构验收标准制定以及实施工作 6.负责物料追踪,售后不良分析回归等工作 7.编写结构标准化设计文档、测试文档及其他相关文档
DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。
1.负责主流大模型(DeepSeek、通义、LLaMA等)的全栈性能优化,涵盖模型架构优化、训练/推理框架调优及底层算子优化,提升模型在单机/集群场景下不同GPU/NPU硬件平台的运行效率 2.开发创新推理加速方案,通过投机采样算法改进、MTP机制优化等框架级特性,提升MOE架构模型推理效率;并通过优化集群并行推理场景的专家负载均衡、计算/通信 Overlap 等特性,提升集群级别的推理效率 3.完成 W8A8 等量化算法研发,并在框架层面支持量化模式下的 TP、EP 等并行模式的性能优化 4.针对多种计算架构(NVIDIA/AMD GPU、国产化 NPU 等)进行深度硬件适配,开发高性能算子库与内存管理组件,实现跨平台性能优化与资源利用率的提升
1、规划并践行前沿数据采集策略,采集AIOS及手机AI agent开发所需多源数据,确保数据完整、高质; 2、架构设计并优化知识图谱,搭建适配AIOS生态与agent决策交互的知识体系,明确节点与边的关系,消除知识冲突与冗余; 3、采用创新方式清洗、预处理数据,转换为契合知识图谱构建的格式,为AI agent在AIOS中的运作提供支撑; 4、密切跟踪AIOS系统更新及agent功能演进,定期更新维护知识图谱,建立智能高效的质量监控体系; 5、与多团队协同合作,为AIOS开发和AI agent优化供应数据与知识支持,推动技术革新。