在人工智能领域,尤其是在大模型(Large Language Models,LLMs)的开发和应用上,小米公司近期的动态引起了行业的广泛关注。本文将详细分析小米在AI大模型领域的最新布局和战略调整,以及这些变化背后的原因和潜在影响。
小米加速AI大模型布局
小米此前在AI大模型领域相对保守,但近期的动作表明其正加快步伐。据第一财经报道,小米高薪聘请了DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉,她可能会在小米AI实验室中担任重要职务,领导小米的大模型团队。这一举措显示出雷军对小米在AI大模型领域起步较晚的担忧,并亲自参与了人才招募。罗福莉的薪酬可能达到千万元级别,这一数字不仅反映了小米对人才的重视,也暗示了其在AI领域的雄心和投入。
罗福莉的背景和贡献
罗福莉在AI领域,尤其是大模型开发方面有着显著的成就和影响力。她硕士毕业于北京大学计算语言学研究所,并在NLP(自然语言处理)领域的顶级国际会议ACL上发表了8篇本文,其中两篇为第一作者,这也使她成为学术界的新星。罗福莉在硕士毕业后加入了阿里达摩院机器智能实验室,主导开发了多语言预训练模型VECO,并将其纳入阿里达摩院的深度语言模型体系AliceMind。她还主导了AliceMind的开源工作,进一步推动了AI技术的共享和进步。2022年,罗福莉离开阿里达摩院,加入幻方量化从事深度学习相关策略建模和算法研究,随后加入DeepSeek,参与MoE大模型DeepSeek-V2的研发。
小米的战略调整和市场定位
小米大模型团队成立时已有6500张GPU资源,显示出小米对大模型的重视。AI实验室主任王斌曾表示,小米不搞AI的军备竞赛,而是更注重轻量级模型的市场空间和特定任务上的优势。小米的目标是通用语言大模型,初步计划的基座模型参数在几百亿,后续会根据实际情况调整投入。小米的这一战略与其他厂商的步步进击形成对比,例如vivo在2023年11月发布了蓝心大模型矩阵,包含自研的十亿、百亿、千亿三个参数量级的语言大模型。
小米的成本考量和市场策略
雷军在2023年年度演讲中提出,小米做大模型的思路可能与其他公司不同,主要突破点在于轻量化和本地部署。考虑到小米也在造车,需要在成本上有所控制。云侧的大模型成本极高,而端侧大模型则能在本地进行运算,节约云端算力开支。小米用户对芯片性能、摄像头技术、屏幕显示等方面有较高需求,端侧大模型虽然在效果上可能不如云端,但在隐私保护、低延迟和成本控制方面有优势。
未来趋势和市场预测
随着AIAgent与手机硬件的融合,AIAgent在人机交互中的精准理解和高效任务完成能力将成为区分手机高低端的关键。IDC预测,到2025年中国新一代AI手机市场出货量将达到1.1亿台。小米的战略调整和人才招聘行动表明,该公司正积极响应市场趋势,加大对AI大模型的投入,以保持在竞争激烈的市场中的领先地位。
本文来自作者[sxkxdz]投稿,不代表快芯号立场,如若转载,请注明出处:https://vip.sxkxdz.com/zixue/202412-122733.html
评论列表(4条)
我是快芯号的签约作者“sxkxdz”!
希望本篇文章《力邀95后科技天才少女加盟团队 小米科技创始人雷军豪掷千万年薪 (95后科研新星简历曝光)》能对你有所帮助!
本站[快芯号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:在人工智能领域,尤其是在大模型,LargeLanguageModels,LLMs,的开发和应用上,小米公司近期的动态引起了行业的广泛关注,本文将详细分析小米在AI大模型领域的最...