利用LoRA架构,苹果智能可以使用同一套设备端LLM模型,来搭配各种不同用途的转接模型,苹果目前已经训练出了语言生成模型的多种转接模型,像是摘要模型,校对模型、邮件回复模型、查找处理模型、友善回应模型、紧急回应模型等,在图片生成也有许多不同用途的专用模型。/苹果
转接模型只有数MB,用内存缓存就能快速切换不同模型
因为设备端像是手机、平板的内存有限,苹果指出,这个大小的转接模型,就可以动态使用内存来缓存,切换不同的转接模型。等于只需要加载一份LLM,可以针对不同任务需求,快速切换不用用途的转接模型,就可以让GAI具备不同用途的专门能力,就可以更有效的管理内存,也能确保在设备上的回应速度够快。
采取LoRA有两大好处,一是在模型预训练阶段,因为主要针对转接模型进行微调,可以大幅减少需要训练的参数量,很容易可以训练出因应不同用途的转接模型,例如用翻译用转接模型、内容摘要用转接模型等。只需要使用不同用途的训练数据,就能微调出适合不同任务的专用转接模型,而不用每次都花时间和算力来微调大型语言模型。
另一个好处是,一个大型大型语言模型,可以搭配使用不同的转接模型,换了一个转接模型,就能拥有这个转接模型所微调后的效果,例如换上「内容摘要用转接模型」,就能提高LLM摘要内容的能力和品质,甚至,可以串接多个转接模型来叠加效果。
若用专业相机的镜头来比喻LLM模型,不同镜头可以提供不同的功能,但是转接模型就像是镜头的滤镜,一个镜头可以搭配不同功能的滤镜,不用每次都切换笨重的镜头,也能单靠快速更换滤镜,就能拍出不同风格效果的照片,一个镜头还能搭配多个滤镜,来呈现复合的效果。
利用LoRA架构,苹果智能可以使用同一套设备端LLM模型,来搭配各种不同用途的转接模型,苹果目前已经训练出了语言生成模型的各种转接模型,像是摘要模型,校对模型、邮件回复模型、查找处理模型、友善回应模型、紧急回应模型等,在图片生成也有许多不同用途的专用模型。
可以用不同专门模型,指挥第三方App来运行特定任务
苹果将苹果智能的功能,高度整合到系统组件中,不同功能用途的组件可以使用对应功能的专用转接模型,来提高运行特定任务的能力。
苹果添加的个人脉络能力,像是语意索引、屏幕文本理解,将用户当下的画面,或与一项行动所需的相关个人化信息,也可以用来分辨,设备端LLM模型可以搭配使用哪些转接模型来强化,符合个人化脉络操作需要的能力,更可以搭配苹果的App意图框架,根据不同的App意图,切换适合这项意图的转接模型。
早在2年前的WWDC 2022,苹果就发表了可让Siri控制的App意图,能让用户用语音指挥Siri来控制某些App的内部行为,更可以通过苹果OS中的捷径功能,组合不同App的行动,打造出一只自动化RPA程序一样,后来发展成了现在App意图框架,到了今年WWDC,App意图是整个系统可以用的基础功能,任何第三方App,都可使用App意图框架,将App内部的核心功能,定义成可以供Siri、Spotlight搜索或是捷径可以操作的App意图。过去几年已有不少第三方App,自定出了数百项App意图,都成了Siri可以指挥的行动,让苹果智能调用这些第三方App,来完成不同用途的功能。
不只如此,过去几年,苹果不断强化设备端的隐私机制,尽可能让用户拥有更大的数据自主权,从2021年上路的ATT(App Tracking Transparency,ATT)政策,可拒绝广告识别码,来避免跨App追踪,可隐藏真实Email的Hide My Email功能,可隐藏用户IP的Private relay,更容易开关的精细权限控管、揭露度更高的App隐私报告。今年更添加了App层级的隐私控制,可以将一只App所用的数据上锁,没有解锁,就无法看到这只App所用的任何数据。这就让用户对设备端上的App,有更高的数据主控权,也能让各种设备端AI代理,更安全、在授权下,完成各项App意图所驱动的行动。
苹果采用LoRA架构和种种模型优化技术,让设备端的LLM,可以快速切换搭配不同的专用转接模型,来提供不同任务需要,更专门的GAI能力,还能用来判读,用户下达的指令背后的意图,可以使用哪些第三方App能支持的行动来满足用户的需求,这就像是一个以用户名义来采取各种行动的AI代理,而且苹果智能的AI代理,还可以只靠设备端LLM,就能完成大部分日常活动需要的任务。
苹果在WWDC主题演讲中,一点都没有提过「AI代理」这个字,这个今年各大科技巨头强打的GAI新主流,但是,采取LoRA架构来实现超强设备端LLM的苹果智能,早已展开了各项AI代理基础工程的布局。
相关报导 【苹果私有AI战略关键2】用5大安全设计落实隐私3准则,打造高度私有的云地混合架构