过去这几年,相信大家都有感触:我们的工作和生活,正越来越多地因为 AI 而变得有所不同。
用手机拍出越来越惊艳的照片、辅助驾驶系统让开车更安全和简单、开会时用智能录音笔实时录音、翻译,还能转写成文稿,甚至在游戏里越来越拟真的人机对战……
这些都是 AI 让我们的生活更加美好、便捷的证明。
(资料图片仅供参考)
而最近,随着 ChatGPT 的火热,生成式 AI 更是在全球掀起了人工智能的新浪潮。它让我们看到人工智能变革世界的新方式。
根据大型聚合网站 THERE"S AN AI FOR THAT 的数据,目前已有超过 3000 个可用的生成式 AI 应用和特性。人工智能,正迎来一个新的“爆发时刻”。
这样的“爆发”,无论对于 AI 自身的发展,还是对我们的生活,都有着不可忽视的意义。
生成式 AI 快速发展背后,混合 AI 将成为 AI 的未来
随着生成式 AI 以极快的速度发展,众多大模型应用和产品涌现,这些拥有数十亿参数的众多生成式 AI 模型对计算基础设施提出了极高的需求。换句话说,AI 需要找到一套新的、适合生成式 AI 的发展模式。
而混合 AI,就是生成式 AI 规模化扩展最重要的模式,也是 AI 的未来。
所谓混合 AI,就是终端侧 AI 和云端 AI 协同工作,在适当的场景和时间下分配 AI 计算的工作负载,以提供更好的体验,并高效利用资源。
具体来说,在一些场景下,计算将主要以终端为中心,在必要时向云端分流任务。而在以云为中心的场景下,终端将根据自身能力,在可能的情况下从云端分担一些 AI 工作负载。
这种架构和模式,可以说是 AI 发展过程中必然要走的路。
就像传统计算正在从大型主机和瘦客户端演变为当前云端和边缘终端结合的模式那样,AI 计算必然会朝着超大规模和复杂化的方向发展,因此 AI 处理也必须同时分布在云端和终端,才能让 AI 发挥最大的潜能。
之所以如此,是因为混合 AI 在成本、能耗、性能、隐私、安全、个性化等各方面都拥有足够的优势,能为生成式 AI 在全球范围内大规模扩展普及提供支撑。
比如首先在成本上。据估计,每一次基于生成式 AI 的网络搜索查询,其成本都是传统搜索的 10 倍 ,而这只是众多生成式 AI 的应用之一。如果把这些运算、处理都放在云端,无论对于规模大小的搜索引擎企业来说,都是一笔很不划算的成本负担。
而混合 AI 架构下,将一些处理从云端转移到边缘侧终端,就可以减轻云基础设施的压力并减少开支。混合 AI 能够利用现已部署的、具备 AI 能力的数十亿边缘侧终端来进行运算处理,这将很大程度上减轻云端基础设施的负担。否则,这数十亿终端的运算就都要压在云端,成本可想而知。
其次是在能耗上,边缘终端能够以很低的能耗运行生成式 AI 模型,尤其是将处理和数据传输相结合时,能够帮助云服务提供商显著降低数据中心的能耗。
此外,在混合 AI 架构中,终端侧 AI 处理也具有更高的可靠性。比如现在大家使用一些大模型产品,在高峰时段也会经常遇到应答很慢、甚至生成失败的情况。而在混合 AI 架构中,由于相当一部分的计算负载转移到终端侧,生成式 AI 查询对于云的需求时就有更大的可能避免高峰拥堵,从而有效减少排队等待和高时延、乃至拒绝服务的情况。
还有,终端侧 AI 从本质上也有助于保护用户隐私,因为敏感的数据和信息可以保留在终端上,无论是对企业用户还是个人用户来说,这一点都是非常重要的。
而隐私安全得到保障后,紧接而来的好处就是个性化的体验成为可能。因为服务提供商能够在不牺牲用户隐私的前提下,最大程度根据用户的个性化数据提供对应的服务,例如我们手机上的 AI 助手就能更深入地了解我们的习惯、兴趣、需求,从而绘制出更精确的用户画像,以提供个性化的服务。而这些用户画像,都是保留在终端内的。
总之,混合 AI 将成为 AI 发展的必然方向,同时这种架构模式将推动生成式 AI 实现规模化扩展和普及,进而深刻改变我们生活与生产的方方面面。
混合 AI 怎样发展?来看看高通的领导力
从上面的介绍中不难发现,终端侧 AI 能力是赋能混合 AI 并让生成式 AI 实现全球规模化扩展的关键。但其实,在生成式 AI 出现之前,AI 的处理能力就已经在向边缘侧终端转移了,手机、笔记本电脑、XR 头显、汽车等众多边缘侧终端也都展现了出色的 AI 处理能力,并有实际应用,比如在手机上的暗光拍摄、人脸解锁等等。
说到这,有一个不得不提的角色,他一直以来都在致力于推动终端侧 AI 的发展,就是高通。
高通在 AI 领域已经深耕超过 15 年,并且已经面向数十亿手机、汽车、XR 头显与眼镜、PC 和物联网等边缘终端提供行业领先的 AI 硬件和软件解决方案,在终端侧 AI 方面拥有相当的领导力。
在软件方面,高通首先是在终端侧生成式 AI 方面有强大的领导力,他们对生成式 AI 的研究可追溯到生成式对抗网络(GAN)和变分自编码器(VAE),利用 VAE 技术,高通创建了更好的视频和语音编解码器,将模型规模控制在 1 亿参数以下。
几个月前,高通还实现了全球首个 Android 手机上的 Stable Diffusion 终端侧演示。Stable Diffusion 是一个参数超过 10 亿的超大神经网络基础模型,能够基于输入的文本提示生成图片。这一终端侧演示是在飞行模式下进行的,通过高通的全栈 AI 优化,这一模型能够完全在终端侧运行,实现在 15 秒内完成 20 步推理,生成饱含细节的图像。
接下来,高通正计划未来在终端侧支持参数高达数百亿的模型,这也将成为基于高通技术的产品的一大差异化优势。
此外,如果在云端运行一个超过 10 亿参数的生成式 AI 模型,可能需要数百瓦的功耗,而高通在终端侧运行需要的功耗仅有几毫瓦。能够支持终端在既定功耗下完成更多处理工作,这也是他们在生成式 AI 领域的独特优势。
高通面向 Stable Diffusion 进行了全栈 AI 优化。去年 6 月,高通推出了专门面向边缘侧 AI 的领先软件栈产品,高通 AI 软件栈,能够支持从软件层面进行模型优化。
例如在算法和模型开发效率上,之前云端服务器上训练的模型一般采用 32 位浮点运算(FP32),这意味着完成模型推理需要大量的处理工作。而针对 Stable Diffusion,高通采用的是 8 位整数运算(INT8)。去年年底在第二代骁龙 8 移动平台上,更是进一步支持了 4 位整数运算(INT4)能力,这将大大提升 AI 运算的效率。
此外,通过高通 AI 引擎 Direct,高通能够以最高效的方式利用硬件能力,结合第二代骁龙 8 行业领先的 Hexagon 处理器,更将在终端上带来远远领先于这一用例的生成式 AI 能力。
通过高通 AI 软件栈,高通已经能够在搭载骁龙计算平台的笔记本电脑上运行 Stable Diffusion,并实现非常出色的表现。凭借行业领先的高通 AI 引擎,基于骁龙计算平台的笔记本电脑在 MLCommons V3.0 上率先实现了出色的 MLPerf 基准测试结果,这个成绩明显领先于行业。
高通 AI 软件栈面向高通合作伙伴、用户和开发人员提供了一个集成所有 AI 框架、开发者库、操作系统的整合平台,让他们得以在搭载骁龙平台的终端上打造出色体验。与此同时,他们还可以使用 Qualcomm AI Studio 提供的所有工具。
总之,高通 AI 软件栈的核心优势在于,模型一旦开发出来,就可以在不同地方使用。它再与混合 AI 部署相结合,形成杀手级的组合,将帮助生成式 AI 在不同终端上进行规模化扩展,实现生成式 AI 的普及。
此外,在硬件方面,高通的硬件能够提供行业领先的能效,是移动领域竞品的近 2 倍。这当中,高通 AI 引擎就是由多个软硬件组件构成,能在骁龙和高通平台上实现终端侧 AI 加速。在硬件方面,高通 AI 引擎采用异构计算架构,包括 Hexagon 处理器、高通 Adreno GPU 和高通 Kryo CPU,全部面向在终端侧快速高效地运行 AI 应用而打造。通过异构计算的方式,开发者和 OEM 厂商可以优化智能手机和其他边缘侧终端上的 AI 用户体验。
这其中,Hexagon 处理器是高通 AI 引擎最关键的部分,在第二代骁龙 8 移动平台中,最新的 Hexagon 处理器采用专用供电系统,能够按照工作负载适配功率。特殊硬件提升了分组卷积、激活函数加速和 Hexagon 张量加速器的性能。支持微切片推理和 INT4 硬件加速能够在提供更高性能的同时,降低能耗和内存占用。Transformer 加速大幅提升了生成式 AI 中充分使用的多头注意力机制的推理速度,在使用 MobileBERT 的特定用例中能带来高达 4.35 倍的惊人 AI 性能提升。
简言之,高通 AI 引擎是高通在终端侧 AI 优势的核心,它在骁龙平台和其他众多产品中发挥了重要作用,是高通多年全栈 AI 优化的结晶,能够以极低功耗提供业界领先的终端侧 AI 性能,这一点相信大家都比较熟悉。
除了高通 AI 引擎,还有一点不容忽视的,就是高通部署的边缘侧终端规模十分庞大,搭载骁龙和高通平台的已上市用户终端数量已达到数十亿台,而且每年有数亿台的新终端还在进入市场。这些终端覆盖一系列广泛的产品,包括手机、汽车、XR、PC 和物联网等等等等。
总而言之,高通凭借行业领先的硬件,支持在既定功耗下实现更高性能;行业领先的高通 AI 软件栈;以及行业领先的工具如高通 AI 模型增效工具包(AIMET)等三大关键要素,构成了其在全球范围赋能混合 AI 规模化扩展的独特优势。
未来,我们到底可以获得怎样创新 AI 应用体验?
前面我们讲到,生成式 AI 方兴未艾,混合 AI 架构的时代正在到来,而高通凭借前瞻性的早期研究和产品开发投入,加上在边缘侧广泛而深入的布局,正成为推动生成式 AI 规模化扩展的领导者。那么,混合 AI 在未来究竟能为我们带来怎样创新的应用体验?这里我们不妨也大胆畅想一下,相信会让大家对混合 AI 的发展更加期待。
混合 AI 驱动生成式 AI 的大规模扩展,无疑将驱动新一轮内容生成、搜索和生产力相关应用的发展,具体,则是通过广泛的边缘侧终端作为载体,包括智能手机、笔记本电脑和 PC、汽车、XR 以及广泛的物联网等品类。
首先是大家日常接触最多、使用最高频的智能手机。其实,我们使用手机最主要的就是搜索信息、获取服务。而随着生成式 AI 的发展普及,我们在手机上搜索信息的方式将发生很大的转变,智能手机将成为我们真正如影随形的数字助手,比如当你结束了一周的工作,周末想放松一下时,只要在手机上问一下,它就能根据你的兴趣、习惯给你制定一套完整的周末游玩、饮食和作息的攻略。特别是当生成式 AI 能够支持文字、语音、图像、视频等其他输入模态时,你和手机的沟通、交流会更简洁和准确,甚至当你外出旅游时,你给它发一张景点的照片,他就能把景点的背景信息、玩法攻略都告诉你,还能给你推荐最适合你口味的餐厅……
在这个过程中,智能手机能掌握到你的用户画像以及所有其他敏感信息,都会保留在终端侧,一些基础的 AI 推理过程也会发生在终端侧,同时云端和终端 AI 彼此协同,实现上面这些用例。而这一切都将基于高通的骁龙移动平台的手机终端来完成。
除了智能手机,还有搭载骁龙计算平台的骁龙笔记本,这主要就是在生产力方面为我们带来助力。
未来,引入生成式 AI 能力的骁龙本,将能够基于视频会议的语音转录内容,快速帮你制定任务清单,并自动生成完整的演示文稿直接供用户使用,使生产力能够成倍增长。
再比如很多人在电脑上都会用的的 Microsoft Office 365,当集成了生成式 AI 能力后,我们的日常工作流将会大大提速,很多内容只需 AI 帮我们完成即可,过去需要数小时或数天的任务,那时仅需几分钟就能完成。
同时重要的是,骁龙计算平台拥有专用的硬件单元,能够原生支持生成式 AI 在本地使用,这与目前市场上其他的产品完全不同。
再者就是汽车领域的创新应用。未来,生成式 AI 驱动的座舱能够提供高度个性化的体验,它将能够帮助你规划出行路线。具体来说就是根据出发点和目的地信息,结合汽车的丰富传感器数据制定不同的路线规划,找到最佳路线,同时在去餐厅的路上推荐用餐选项,或者在上班途中列出今日的工作事项。
再比如,届时汽车还将能够识别每位驾乘人员并提供定制化的音乐和播客等体验和内容,座舱的媒体娱乐体验也将会变革。随着车载 AR 应用变得更加普遍,数字助手可以按照驾乘人员的偏好提供定制化的显示。
还有,汽车的维修保养和服务也将变得更加自主和无缝。通过分析传感器输入、维修保养历史和驾驶行为等数据,数字助手可以预测何时需要进行保养……
这些每秒的场景,将有赖于高通的骁龙座舱平台来实现。以最新一代骁龙座舱平台为例,就能够提供业界领先的车内用户体验,以及安全性、舒适性和可靠性,成为网联汽车时代为数字座舱解决方案的全新标杆。
在混合 AI 架构驱动下,生成式 AI 也能为 XR 带来巨大的应用前景,其中最值得看好的,应该是对 3D 内容创作的普及。在下一代 AI 渲染工具的加持下,你可以只需输入文本、语音、图像或视频等各种类型的提示,就能生成 3D 物体和场景,并最终创造出完整的虚拟世界。比如当你需要给家里设计装修方案时,你只需在 XR 中说出具体的装修方案,就能渲染出最终的装修结果,而你可以置身其中,根据不同的渲染结果选择最优的方案。
也许这样的场景对你来说听起来还有些遥远,但对于高通来说,正在一步一步实现的路上。比如前面我们说到的 Stable Diffusion 等文本生成图像类的模型,很快将赋能内容创作者在 3D 物体上,生成逼真的纹理。根据高通的估计,一年内这些功能将在智能手机上实现,并延伸到 XR 终端。
而未来几年,首批文本生成 3D 和图像生成 3D 类的模型将可能实现边缘侧部署,生成高质量的 3D 物体点云。几年后,这些模型将通过提升,达到能够从零开始生成高质量 3D 纹理物体的水平。在大约十年内,模型将更进一步,支持由文本或图像生成的高保真完整 3D 空间和场景。
最后是在广泛的物联网领域,生成式 AI 也能够助力打造面向专业领域的 GPT 类型模型,以及帮助用户完成不同任务的 IoT 助手。比如当你来到一个新的城市,生成式 AI 能够为你提供旅行目的地推荐。此外它还适用于其他的垂直领域,如医疗、零售、酒店管理等等。
比如在零售领域,未来,商场导购员只需在售货亭或智能购物车旁,就能基于每周特价商品、预算限制和家庭偏好帮助顾客定制带有菜谱的菜单。商店经理可以根据即将发生的事件预测非周期性的促销机会,并进行相应准备。
他们还可以通过简单的提示,就让 AI 辅助重新排列货架商品,为利润高的产品腾出空间,或者利用附近连锁店的数据,尽可能降低产品缺货情况的发生……
总体来说,当混合 AI 逐渐发展成为主流,生成式 AI 就能得到持续演进,并带来越来越多变革性的创新应用体验,通过搭载高通和骁龙各类平台的边缘侧终端,我们就能切身感受到混合 AI 如何颠覆我们生活、工作以及娱乐的方式。
结语
混合 AI 的趋势不可阻挡,从眼下开始,云端和终端侧 AI 的协同将更加紧密,通过强大、高效且高度优化的 AI 能力打造下一代用户体验。而高通在终端侧 AI 的强大的领导力将为他们向混合架构转型带来独特的优势,他们拥有在 AI 领域超过 15 年的前瞻研究和产品投入,有卓越的终端侧 AI 技术和全栈优化的体系,更有广泛且数量庞大的全球边缘侧终端布局和规模,而接下来,他们要做的则是更紧密地支持开发者、OEM 厂商和其他生态系统创新者快速高效地构建全新生成式 AI 应用和解决方案,让技术和生态有完整的落地。
未来,当我们享受着混合 AI 带来的全方位提升的生活体验时,别忘了高通在背后的推动作用。