AI PC后时代:重新理解大模型的最佳载体

发表时间:2024-05-10 15:02


如果站在人机交互变革的角度来畅想,AI PC所带来的变革可以说是人机交互史上的又一次“颠覆”。元宇宙时代下,是苹果让AI装进了Vision Pro里;那么在如今的AI时代,又将会是谁将AI PC彻底照进现实?谁才是最终赢家?

作者|思杭

编辑|皮爷

出品|产业家


埃尼亚克ENIAC——世界上第一台电子计算机,是二战时期由六名女性主导编程出来的。那时,包括她们在内的所有女性都不得踏入ENIAC房间。站在当下的现代社会去回看历史,女性地位在当时呈现出一种极端的状态——这六名女性的名字在过去很长一段时间都不能出现在“功劳簿”上,尽管她们对于现代编程的意义尤为重大。

The ENIAC,来源:history.com

而这是历史上出现的第一次人机交互。

在随后的半个多世纪里,从施乐公司引领的“图形用户界面”变革,到苹果公司引领的“触摸交互界面”变革,历史上的每一次人机交互变革都在全球PC市场上掀起过惊涛骇浪。这种演进历程除了带给用户实用性、娱乐性、便捷性以外,它所承载的更大畅想是一个数字版的“乌托邦”世界。

而今天的“AI变革”就是让这一畅想在未来有一天会变成现实的载体。比如现在的电脑只是工具,而未来的电脑则可以是一个超级助手。它可以通过存储用户使用电脑的个人习惯和知识,来代替用户完成基本工作,甚至创意性工作。更重要的是,这种AI电脑的隐私性也不再是问题。

然而,在这种乌托邦式的“AI电脑”还未到来之前,几个值得探讨的问题是:如何将AI装进个人电脑里?个人电脑又如何能进行大规模的AI计算?这对于芯片等硬件提出了怎样的要求?硬件之外,软件层又将会迎来哪些变革?

随着一场由AI主导的人机交互变革再一次引爆PC市场,一系列问题也正在成为PC舞台上的焦点。

一、端侧大模型到底成色如何?

从手机的摄像头到智能穿戴设备,从汽车到智能家居,每一个输入和输出点都可能成为AI施展拳脚的舞台。

2023年初,在巴塞罗那举行的MWC世界移动通信大会上,期间荣耀发布了魔法OS 8.0、魔法大模型、Magic6 Pro手机等产品;高通和联发科展示了更多AI能力的芯片。同年,三星、vivo、OPPO、荣耀、华为、小米等手机厂商开始将大模型能力应用在手机产品上,AI手机加速渗透。

自此,一场发生在终端上的AI变革也正式拉响。先是手机,然后是智能穿戴设备,再接下来是汽车、智能家居,似乎一切终端都可以和AI“相加”。

那么,为什么各种终端场景都在与AI结合?

从大模型的落地发展趋势看,从云端向终端推进是目前的重点发展方向之一。如果所有的部署方式都在云端,则需要通过终端访问云端,虽然这种方式能够保证有足够的参数量和算力,但对于轻量化、低时延的任务,显然不具备优势。

而端侧AI的核心也正在于,它能够在不依赖云端服务器的情况下,快速响应用户需求,处理本地数据,保护用户隐私。

但将大模型部署在端侧仍然存在一些挑战。最显而易见的难题则是,如何保证端侧大模型有足够的算力支撑?

从目前市场上的端侧大模型来看,一个符合常理的规律是:设备端越大(功能越多),其端侧大模型的参数量也越大。

2024年2月,面壁智能联合清华NLP实验室发布并开源端侧大模型面壁MiniCPM,参数规模20亿;

2023年9月,小米AI大模型亮相,参数规模13亿;

2023年1月,荣耀发布端侧平台级AI大模型——魔法大模型,参数规模70亿。

上述是部署在手机上的大模型,可以看到其参数规模并无法与如今位列海内外第一梯队的大模型相媲美。而对于功能更受限制的智能穿戴设备而言,其端侧大模型的参数规模则只会比手机更小。但值得注意的是,荣耀的骁龙8则是搭载了有着70亿参数规模的魔法大模型。

在过去与媒体的对话中,荣耀研发管理部总裁邓斌也曾透露,“端侧运行大模型受算力、带宽、功耗等影响,在端侧运行70亿参数模型已经到了极限。”

但在最近的2024北京车展上,商汤亮相的“日日新5.0”可以说是一个重磅炸弹。其采用混合专家架构(MOE),是国内首个全面对标甚至超越GPT-4 Turbo的大模型,参数规模达到6000亿。而这是一个更适合车端部署的端侧大模型。

实际上,无论是荣耀的魔法大模型,还是商汤的日日新,端侧大模型都有一个特点,即参数大的大模型部署在端侧,一定会通过“蒸馏”技术把大模型进行压缩,再封装到端侧。

虽然大模型会随着参数量的不断增加,而开始“涌现”,并呈现出Scaling Law(规模效应),这也是为什么现在大家都在拼参数的重要原因;但从模型应用来看,模型的参数量并非越大越好。最理想的状态应该是:用尽量少的参数量,来实现尽可能好的效果。

因此,封装到端侧的大模型都需要进行“蒸馏”处理。例如,Google的MobileBERT模型就通过知识蒸馏等技术,大幅减少了模型参数量,使之更适合在移动设备上部署。

另外,除了“蒸馏”处理以外,从手机向PC端进化,则还需要能够保证端侧大模型正常运行的芯片。实际上,过去一年半以来,已经有不少芯片厂商推出了适用AI PC的芯片。

2023年10月,高通在骁龙峰会期间推出了面向PC打造的Arm架构全新处理器:骁龙X Elite;

2023年12月14日,英特尔发布Meteor Lake的酷睿Ultra处理器,这是一款集成了人工智能加速引擎NPU的CPU;

2024年4月,AMD推出适用于商用笔记本电脑和台式机的AI芯片——锐龙PRO处理器。

不仅仅是芯片,自英特尔于去年10月发布“AI PC加速计划”以来,整条产业链的生态也正在显现出自身的模样。从独立硬件供应商到独立软件供应商(ISV),随着底层芯片和上层AI PC的“各就各位”,一些软硬件兼容问题也将加速得到解决。

然而,兼容适配并非易事。不同设备的硬件配置千差万别,操作系统、开发环境的多样性,要求大模型必须具备高度的灵活性和可移植性。此外,部署在PC端的大模型还需要保证用户隐私,这就要求在有效利用本地数据进行模型自适应学习的基础上,还要解决隐私性的问题。

二、谁在成为试水者?

“我们认为AI PC是未来几年PC市场的一个关键转折点。”2023年9月,英特尔在加州圣何塞举办的“Innovation 2023”峰会上,其CEO基辛格首次提出AI PC概念。

这是英特尔的大型芯片发布会现场。而在展示其三代AI芯片路线图的同时,英特尔还特别强调了即将推出的酷睿Ultra处理器“Meteor Lake”,该处理器被英特尔视为40年来最重大的处理器架构变革,也是一款能够搭载AI PC上的芯片。

这款处理器不出意外地在2023年12月正式亮相。实际上,作为芯片巨头,英特尔在AI PC的方面的进展,一直都是从硬件层面出发,通过集成AI加速器、优化CPU架构,从而为AI应用提供底层支持。

早在2018年,英特尔就开始了AI PC的布局。当时的“雅典娜计划”(Project Athena)便是其在AI PC上的一种尝试,尤其是在电池管理、语音识别和安全性方面的优化。比如英特尔的第11代酷睿处理器集成的GNA单元,专为低功率AI处理设计。

而在国际市场上,微软则是一支不可忽视的力量。作为操作系统领域的领头羊,微软早在2019年便在其Windows 10系统中融入了AI元素,比如Cortana智能助手和机器学习驱动的性能优化功能。

“我们的目标是让每一台Windows PC都能享受AI带来的效率提升。”微软CEO萨蒂亚·纳德拉曾表示。

在AI PC的布局方面,微软所侧重的是操作系统层面上的智能化,比如通过Windows的更新迭代,不断深化Cortana的功能,同时利用AI优化系统性能和用户体验。

而为了迎接“AI PC元年”,微软也在今年3月推出了Surface Pro 10商用版和Surface Laptop 6商用版。

最后,在AI PC市场上真正走在前列的,则是国内PC制造商“联想”。2023年12月,联想先是发布了AI Ready的AI PC产品,包括ThinkPad X1 Carbon AI和联想小新Pro 16 AI酷睿版。这些产品搭载了Intel酷睿Ultra处理器,并配备了AI专属芯片NPU,以提供强劲的本地混合AI算力。

“联想AI PC将经历AI Ready阶段,并在2024年迈入AI On阶段,届时每个人都将拥有自己的个人AI助理。”联想集团副总裁阿不力克木·阿不力米提曾在大会上这样说道。

紧接着,2024年4月,联想就再次发布AI PC新品,内嵌个性化AI智能体的“联想小天”正式亮相。

实际上,联想对AI PC的构想是将其打造为个人AI助理,提供个性化创作、私人秘书和设备管家服务。联想AI PC的本地混合AI算力是其核心特征之一,具备内嵌个人智能体实现多模态自然语言交互,以及个人大模型和本地知识库。

早在2020年,联想就推出了推出了搭载联想智能引擎LCE的Yoga系列AI笔记本,旨在通过AI技术提升用户体验,如智能散热调节、场景识别等。

可以看到,在AI PC的战队中,联想属于“务实派”,其更注重AI在实际应用场景中的落地,通过其智能引擎LCE,实现在散热、续航、交互等方面的智能优化。

另外,除了联想、微软、英特尔等国际知名厂商,还有一个不得不提的PC制造商——苹果。就在发稿前不久,苹果迎来了一年一度的发布会,而在本次发布会上,最惊艳的不过是专注于AI的M4芯片。

因此,从整体市场格局来看,一方面,联想、微软、英特尔等品牌正在凭借其自身影响力和技术积累,占据主导地位。虽然目前AI PC尚处于市场培育期,但各厂商也正在探索适合自己的路径。

另一方面,华为、小米等新兴势力则正在凭借其在智能手机领域的AI经验,尝试跨界进入AI PC市场,通过整合软硬件优势,形成新的竞争态势。

而在模型层方面,目前主要是正在为开发者提供轻量级大模型的厂商,比如Google、面壁智能和Meta。

资料来源:各公司官网,中金公司研究部

但未来,随着模型压缩、蒸馏等技术的技术,更多复杂的大模型有望在PC端实现高效运行,如OpenAI的GPT系列、阿里云的通义千问、腾讯混元、百度文心系列等等,都有可能成为端侧AI PC的重要组成部分。

实际上,大模型的压缩技术在市场上也得到了一些检验。比如联想基于大模型压缩技术,将LLM压缩至轻量化模型进行本地部署,目前Lenvo AI Now助手的大模型就来自阿里云的通义千问,从14.4GB的原始大模型压缩到4GB,电脑配置5-6GB的内存即可运行。

那么,随着产业链的愈加成熟,AI PC时代正在加速驶来。据IDC预测,AIPC有望在2027年渗透率达到85%。

可以预见的是,在AI成为时代潮流趋势的当下,这种由AI主导的变革也正在引爆PC市场。

三、AI PC的“未来畅想”

“AI PC元年”被提及得次数越来越多,但这个赛道还缺少一个“杀手级”应用。

去年9月,在联想创新科技大会上,联想发布“AI PC加速计划”的同时,基辛格向ISV们喊话,“要想知道‘杀手级’应用是如何诞生的?答案是就差你们了。需要靠你们来共同塑造AI PC生态,创造出杀手级应用”。

诚然如此,杀手级应用,对于AI PC来说就像能引爆行业的导火索。元宇宙时代,苹果的Vision Pro成为了背后的导火索;而如今的AI PC时代,则要靠整个生态的完善。

不仅如此,要想把大模型装进PC,真正要解决的问题还包括模型压缩技术,与此同时还要保证硬件性能跟上,以及如何确保隐私安全性和软硬件兼容等等问题。

那么,在如今数字化转型的浪潮中,AI PC正逐渐成为科技巨头们竞相布局的蓝海。微软、联想、英特尔、惠普、华为、小米等业界领航者,也正在以前瞻性的战略眼光,描绘出AI PC的未来图景。

首先,微软视AI为未来操作系统的核心,计划通过Windows的不断进化,使AI PC成为用户的个人助理和生产力工具。目前,微软正投资于先进的机器学习模型,比如进行更高效的数据处理、个性化服务,加强云端协同等等。

而同样也提到”个人助理”的还有联想。其中,打造个人AI助理,提供个性化服务,是联想AI PC的战略路线图。另外,在生态方面,联想也通过“AI PC加速计划”,通过与软硬件厂商合作,从而占据优势地位。

而英特尔作为芯片厂商,则是通过硬件创新,推动AI PC进步。对此,英特尔还计划通过下一代CPU集成更强大的AI加速模块,如更高效的神经计算棒,为AI PC提供低延迟、高能效的计算能力。英特尔的愿景是使每台PC都能成为边缘计算节点,实现本地数据分析与即时反馈,同时与云端协同,为用户提供无缝的AI体验。

最后,作为在AI PC领域的新兴势力,惠普、华为和小米则分别从AI企业解决方案、AI芯片和智慧家居IoT的角度,来共同参与AI PC的市场变革。

另外,在硬件侧,为了适应AI PC市场,产业链上游的芯片侧都需要进行产业升级。比如,如何保证大模型能在端侧有足够的算力?这就需要操作系统也需要能够满足移动场景下的算力需求,另外电池能耗、手机存储等等问题也被一一摆到台面。

据Trendforce,微软计划在Windows12为AIPC设置最低门槛,需要至少40TOPS算力和16GB内存。而在芯片侧也发生了结构性的变化,比如架构变化、异构计算和内存升级。

伴随着英特尔、联想和微软等一众国际厂商赋予AI PC的新概念,整个PC市场的爆发也将随之而来。无论是站在提升生产力的角度,还是站在AI时代的大背景下,这一轮的AI变革必将点燃PC行业的热情。

回顾AI大模型在国内“狂飙”的两年时间里,AI基建已经逐渐走向成熟,而PC则正是让AI落地的终极载体。原因很简单,如今关于大模型的讨论点,已然从大模型本身升级为AI Agent、超级助理和智能体等等,那么能实现这一跃升的最佳载体便是PC端了。

如果站在人机交互变革的角度来畅想,AI PC所带来的变革可以说是人机交互史上的又一次“颠覆”。元宇宙时代下,是苹果让AI装进了Vision Pro里;那么在如今的AI时代,又将会是谁将AI PC彻底照进现实?谁才是最终赢家?