登录

会员权益

获取需求

查看名片

专属客服

尊贵标识

VIP低至1.5U/天

【LLM应用采用实例】老牌导航大厂TomTom如何打造新一代车用助手

分享

支付動態

2024-06-21

ChatGPT问世后没多久,TomTom就开始打造智能座舱助理App。他们先验证概念,再以LangChain实作,并搭配5项内核技能技术,打造原型App并集成座车实测

专攻导航与图资的荷兰厂商TomTom打造一款智能座舱车上助理,驾驶用语音提问,如导航去特定的充电站、调高温度,就能得到相对应的回复。/TomTom

选定LLM大脑搭配5大技术

「早在2023年,我们就开始动手做了。」TomTom数据科学家Massimiliano Ungheretti指出,团队当时受到ChatGPT启发,认为这类大型语言模型(LLM)可作为智能座舱的大脑,来协调操控行车大小事。有了大脑,他们还需要「耳、口、手、短期记忆、知识」才能完成驾驶指令,而这5项内核技能,分别对应到自动语音识别、文本转语音、功能/插件/动作、对话状态,以及矢量搜索和检索增强生成(RAG)等技术。

Massimiliano针对最后一项说明,虽然LLM大脑很聪明,但未必具备特定知识,因此他们决定采用RAG方法、而非微调,来更有效率地补足大脑专业知识。

划定这些架构后,团队得先试水温,采用Azure OpenAI服务和其他指令微调过的LLM作为大脑,并搭配提示工程,来验证智能座舱助理概念。他也提到,采用提示工程,「能带来更好的迭代速度,加速产品正式上线。」

步骤1:概念验证

进一步来说,在概念验证(PoC)阶段,TomTom将概念设置为「可用推理行动ReAct提示工程,来将Davinci GPT串接到TomTom服务。」Massimiliano表示,为验证这个概念,他们首先利用微软AI开发平台Azure AI Studio中的游乐场(Playground),来进行测试。

Azure AI Studio平台提供多种模型和API,来供企业尝鲜、测试,在今年大会中还正式上架了强大的多模态模型GPT-4o,以API和模型形式提供,这也是TomTom团队接下来要尝试的模型之一,尤其用来发展更好的语音对话体验。

为打造车用助理,TomTom先是设置内核概念,接着在Azure AI Studio中的游乐场(Playground)来快速测试。可行后,再通过开源LLM开发框架LangChain来实作、迭代。/微软

步骤2:用LangChain开发迭代

回到2023年初,当TomTom在游乐场验证概念后,接着将概念验证结果,利用当时问世没多久的开源LLM开发框架LangChain重现,进而迭代。

在这阶段,他们已将LLM大脑与智能座舱内核技能链接,可实现简单的交互。但「这只在我的机器上运行!」Massimiliano点出,为让这个成果大规模扩展、取得更多回馈以进行更多迭代,他们将应用程序上云。

TomTom揭露智能座舱车用助理的开发流程,首先在游乐场中利用提示工程来测试内核概念,接着使用LLM开发框架LangChain来实作。为取得更多回馈加速迭代,他们将原型App上云,并简化基础设施管理工作。最后,他们将原型App集成至既有服务中,同时也进行各项品质评估、强化安全防护等。/TomTom

步骤3:上云扩大用户

于是,TomTom评估后采用Azure容器应用程序,兼顾上云和无服务器特色,既能让更多人使用智能座舱原型App,团队也只需维护少量基础设施、专注智能座舱助理开发。同时,他们也采用Bicep语言来部署Azure资源,实现基础设施即代码(Infra as Code),简化基础设施管理工作。

同时,在这个阶段,团队还得考量App上云后的记忆和知识存储。于是,他们选用Azure Cosmos DB数据库来存储智能座舱的对话与知识,Massimiliano补充,在知识部分,团队还添加矢量与RAG数据,来补强智能座舱的特定知识。

他还强调,在App中增添语音或文本对话功能,就得考量对话长度增加所带来的性能减退问题,而管理上下文长度、确保输入模型的Token量限制,或采用一些框架来动态剪枝,或保留些时间给对话,都是能兼顾短期记忆和App性能的建议作法。

至于知识部分,因团队采用RAG,也就是搜索知识数据库、将最合适的答案回复给用户。但「最棘手的是如何吸收这些知识,尤其是,如何对大型文档拆分、呈现这些数据给LLM,比如回传给模型前先进行摘要。」Massimiliano表示,这是开发者会面临的另一个挑战。

步骤4:集成准备上线

完成上述步骤后,接下来就是将迭代成果集成至既有服务中,并进行各项品质评估。「这并不容易,」Massimiliano解释,因为LLM可能给出随机回答,若用另一个LLM来检测这个LLM的输出值,则又更加随机。

与此同时,走到这一步的TomTom团队,也开始思考是否要放弃LangChain。但后来回顾,也只是因为当时太早使用了,随着越来越多任务具和配套资源出现,他们并未舍弃这个框架。

在这个阶段,他们也思考,除了短期记忆,应该也要增添整体智能座舱的长期记忆,来达到更好的对话体验。最后,还有一件上线前的必做事项:红队演练与安全防护。

如何进行演练呢?Massimiliano建议,起初可挑一个自动红队框架,并举办一个小型黑客松,来让人组队攻击智能座舱App,再将这些经验纳入自动红队框架中。此外,使用Azure OpenAI或其他框架的审核过滤器等功能,也能强化App保护。

从中学到的2件事

Massimiliano演讲时展示的实测结果,正是完成上述4大步骤的TomTom智能座舱原型App,已成功集成至座车,该原型App也持续优化中。

Massimiliano点出,团队从这段经验,也学到2大重要课题。首先,为跟上快速发展的AI步调,开发者要找出最小可验证的核心概念,来快速迭代、发展许多原型。他表示,开发者甚至可独立于主要App,来验证新概念,再将学习到的知识融入主要App中。接着,开发者要进行无止尽的迭代,因为技术和期望「每天都在变化。」

再来,要确认这些原型是否有价值,就得让原型App接触更多人群、得到使用回馈,才能进一步改善。这时,就得将原本地端的原型转为云端App,采用一些现成云端服务、使用模板,就能快速实现这一点,并专注于内核概念发展、做出差异化。

 相关报导 

免责声明:
详情
HUIDU.io

GROWTH DRIVEN GLOBAL PTE. LTD. 202618650K

101 THOMSON ROAD, #28-03A, UNITED SQUARE, SINGAPORE 307591

Copyright 2026 HuiDu