高通AI负责人:云端很难完成所有生成的AI负载

日期:2023-06-25 18:08:39 / 人气:52

“混合AI模式”是一个合理的方向。本站|彭鑫“很难在云端完成生成AI所需的所有工作量。”6月16日,高通技术公司产品管理高级副总裁兼AI负责人Ziad Asghar在接受本网采访时表示,云处理中存在成本的乘数效应。用户查询的次数越多,模型就会越大,导致云的成本上升。不仅如此,应用和用户数量的增加也会导致成本的增加。因此,高通提倡所谓的“混合人工智能”模式。ChatGPT引发的人工智能大潮席卷科技行业,科技巨头们都渴望找到自己的位置。以手机芯片闻名的高通坚持认为,云并不是生殖人工智能的全貌。在手机、电脑和物联网的“终端”,高通有机会。Ziad Asghar表示,在高通的概念中,混合AI的优势在于结合了云和终端各自的优势:一方面,对隐私和安全要求较高的终端端工作量可以通过边缘云继续在终端端完成。同时,通过在云和边缘终端之间分配工作负载,我们可以大大降低云的处理能力。另一方面,对于其他重负载的AI模型处理工作,可以由云服务提供商来完成。Ziad Asghar还认为,基于云处理生成性应用程序仍然存在隐私问题,终端侧处理正好可以解决这一问题。“比如用户发出查询,终端收到后能够独立完成推理,那么所有相关的查询信息和数据都会留在终端上。”事实上,相比于“人工智能”二字与GPU巨头英伟达的深度绑定,高通对自研AI技术的应用多用于网络信号处理、图形和音频优化。Ziad Asghar表示,高通长期以来一直专注于脉冲神经网络(SNN)的研究,研究和开发AI超过15年。无论是手机上搭载的骁龙芯片、人脸识别还是卷积神经网络,高通都有AI能力。“我们独特的优势是,骁龙计算平台有一个专用的硬件单元,可以原生支持生成式AI的本地使用,这与目前市场上的其他产品完全不同。”齐亚德·阿斯加尔说。在2023年世界移动通信大会(MWC)期间,高通展示了其在Android手机上运行文生图稳定扩散模型的能力。稳定扩散是最近流行的一种AI模型,它可以基于文本输入创建图像。该模型有超过10亿个参数,之前仅限于在云端运行。但相对于ChatGPT模型数千亿的参数,稳定扩散在数据尺度上有很大不同。“许多关键的生成式AI模型,如文本生成图像、自然语言处理、编程、图像理解、图像创建等。,一般都是10亿到100亿的参数。”Ziad Asghar表示,他介绍,未来几个月,高通将有望支持超过100亿参数的模型在终端侧运行。“为了稳定扩散,我们采用了8位整数运算(INT8)。去年年底,我们在第二代骁龙8移动平台上进一步支持4位整数运算(INT4)。”Ziad Asghar表示,高通致力于在硬件、软件和工具设计方面发挥人工智能在端侧的优势。随着算法越来越复杂,计算量越来越大,高通认为,手机、汽车、无人机、数万亿的物联网设备都需要具备更强的人工智能能力。Ziad Asghar介绍,在云服务器上训练的模型一般采用32位浮点运算(FP32),这意味着需要大量的处理工作来完成模型推理。高通希望通过整数运算模式和量化技术进行AI推理,加快模型推理结果的获取。智能手机市场不景气,主要销售手机芯片的高通面临挑战。5月4日,高通公布第二财季财报,营收同比下降17%,至92.8亿美元,净利润同比下降42%,至17.04亿美元。其中,QCT(半导体业务)部门的核心业务手机芯片销售额下降17%,为61.1亿美元。根据市场研究机构科纳仕公司的数据,2022年,全球智能手机出货量连续四个季度下滑,全年市场整体下滑12%,总出货量跌破12亿部。其中,中国市场2022年出货量减少14%,至2.87亿部,创10年新低。对于高通来说,在下行的市场环境中,生殖人工智能是它希望向投资者传递信心的关键部分。在第二财季电话会议中,高通CEO安萌表示,对生成式人工智能模型的需求正呈指数级增长,ChatGPT、Stable Diffusion和DALL-E等生成式AI模型在短时间内已经扩展到数百万用户。高通认为,这项技术将快速发展,继续流行,并改变移动、个人计算和汽车领域的用户体验。

作者:三牛娱乐注册登录平台




现在致电 5243865 OR 查看更多联系方式 →

三牛注册登录平台 版权所有