背靠智能语音助手,大模型在手机上的竞争已经开始。
在华为开发者大会2024上,华为相关负责人介绍了智能语音助手小艺接入盘古大模型能力后的表现。小艺可以与用户语音交互,进行手机应用间的协作,减少了此前业内语音助手普遍具有的机械感。这与苹果语音助手Siri将进行的更新颇有相似之处。
苹果此前已在WWDC开发者大会上推出了与AI相关的更新,包括推出Apple Intelligence套件,该套件深度整合进苹果产品中,可设置置顶推送等功能,适用于搭载A17 Pro芯片的手机和搭载M系列芯片的设备。苹果还与OpenAI合作,苹果将采用GPT-4o,苹果用户在不创建账户的情况下可免费使用ChatGPT。
AI时代的手机范式,已经在用户端展示出了冰山一角,而在苹果Siri“换脑”接入GPT ,华为小艺靠盘古能扳回一局吗?
苹果之后又一个智能语音助手更新
华为开发者大会2024上,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东回顾了华为在端侧AI方面的布局,包括2017年发布的搭载麒麟芯片的Mate 10手机在业界首次支持mobile(移动)AI。一开始,手机AI功能包括相机拍照增强和AI翻译等,后续华为走向个人终端AI化,支持语音、视频等能力,近两年随着产业进入大模型时代,小艺搭载的大模型变得更强大。
大模型基础能力上,华为常务董事、华为云CEO张平安发布了盘古大模型5.0,包括面向跨领域多任务场景的万亿级参数Pangu S系列,适用于处理复杂任务的千亿级参数Pangu U系列,面向低时延、低成本推理场景的百亿级参数Pangu P系列以及支撑手机、PC等端侧智能应用的十亿级参数Pangu E系列。华为云盘古大模型聚焦行业应用,手机是应用领域之一,小艺背后有盘古大模型5.0能力支撑。
大模型能力支撑下,小艺记忆能力有所增强,支持23类常用记忆类型,可以基于记忆自动填写各种表格。此外,小艺也有更高的推理规划能力,掌握万亿token的知识量。华为此次介绍的小艺功能,则与苹果Siri将推出的新功能颇有相似性。
小艺的功能包括,可识别和处理文字、图片等素材,例如一键生成表格、摘要、创建日程等。同时,小艺可在不同应用间协作。例如,收到一个团建邮件后可以跟小艺说导航去这个地方,而不需重复说目的地,小艺便可规划路线。跟小艺说将某日的日程安排短信发给某人,小艺就会从日历中调取相应安排并发送短信,而不需人为查询操作。
苹果此前推出Apple Intelligence个人智能系统并更新Siri功能,Siri也有相似的多模态能力,包括根据用户描述搜索图片并从图片中提取相应信息。苹果此前重点介绍的Siri功能也包括不同应用间协作和上下文理解能力。例如,当用户询问某地天气后可要求Siri为该地的活动设置日程,而无需再强调地点,当朋友发来地址时,可直接要求Siri将地址加入朋友名片。
苹果和华为先后推出更新,或意味着这种与语音助手更自然的交互方式,以及语音助手对应用程序的调度能力,将是大模型给手机带来的最主要改变之一。此外,苹果和华为都以几十亿参数级别的大模型支持端侧AI应用,一定程度上避开数据上传至外部服务器或公有云上的隐私泄露隐患。
据苹果此前发布的大模型技术文档,Apple Intelligence包含一个约30亿参数的端侧模型和一个云端模型,后者通过私有云计算并在Apple芯片服务器上运行,而不在公有云上。华为Pangu E系列也是十亿级参数大模型,鸿蒙原生智能采用模型本地化的方式,不让敏感数据上云。记者从手机业内人士了解到,考虑到端侧算力,目前适合在手机端侧运行的大模型正是在几十亿参数级别。
手机端侧AI是否有其他可能
除了通过本地部署模型支持语音助手等功能外,大模型在手机上应用的其他路径,似乎并未十分清晰。
除了在本地运行的端侧大模型,此前苹果还宣布iPhone将接入ChatGPT。ChatGPT由OpenAI开发,微软则是OpenAI的云供应商。在用户同意的情况下,ChatGPT可接入Siri,为用户提供问答等服务,苹果承诺使用ChatGPT时用户请求和信息不会被记录。但外界对此做法并不都持赞许态度。特斯拉CEO马斯克便质疑用户将数据交给苹果的隐私风险,认为苹果将用户数据交给第三方人工智能公司的做法没有保护用户隐私。
是否接入第三方人工智能公司在外部服务器上运行的大模型,这可能是手机厂商面临的一个难题。如果不接入外部大模型,本地运行的模型能力始终有限。而如果让手机厂商自研能力能与ChatGPT最先进版本媲美的大参数模型并让大模型在私有云上运行,似乎也不太现实。
目前手机厂商对于端侧AI应用形态还在探索中。一名国内手机行业从业者告诉记者,公司正在研发大模型,但自研大模型还不能很快满足所有业务需求,其所在的部门正在尝试与外部大模型厂商合作,要求将外部闭源大模型运行在公司自有的服务器上,避免用户数据泄露。