小米大模型技术商务
社招全职A199128地点:北京状态:招聘
任职要求
核心能力要求 数据判断:买训练语料时,能判断数据质量(清洗程度、OCR 准确度、去重后的真实增量)、领域稀缺性与可交付性;会设计抽样验证,不被精选样本误导,给出"值不值得买、值多少钱"的明确判断。 API 判断:熟悉 LLM API 供给生态,能主动挖掘新厂家;并通过小成本 POC 实测,从一堆同类厂商中筛出真正稳定、性价比高的。 技术理解:了解大模型训练/推理基本…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位职责 开拓渠道:自主挖掘并维护数据、API 等上游供应渠道,建立并动态更新供应商资源池,不依赖现成名单。 采购训练数据:寻找文本、图书等大模型训练语料供应商,独立完成接洽、抽样验证、谈判与签约。 对接 API:覆盖一手模型厂商、云托管、开源模型托管及周边 API(向量库、Embedding、语音、多模态等),持续挖掘新厂家与低成本优质渠道。 价值判断:独立判断数据值不值得买、API 厂商能不能用,给出明确结论与依据。 谈判落地:主导价格、授权、SLA 等条款谈判,推动合作落地并控制成本。
包括英文材料
OCR+
https://www.ibm.com/think/topics/optical-character-recognition
Optical character recognition (OCR) is a technology that uses automated data extraction to quickly convert images of text into a machine-readable format.
https://www.youtube.com/watch?v=or8AcS6y1xg
Optical character recognition (OCR) is sometimes referred to as text recognition.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••