灰度_找资源，谈合作，上灰度

ChatGPT问世后没多久，TomTom就开始打造智能座舱助理App。他们先验证概念，再以LangChain实作，并搭配5项内核技能技术，打造原型App并集成座车实测

专攻导航与图资的荷兰厂商TomTom打造一款智能座舱车上助理，驾驶用语音提问，如导航去特定的充电站、调高温度，就能得到相对应的回复。／TomTom

选定LLM大脑搭配5大技术

「早在2023年，我们就开始动手做了。」TomTom数据科学家Massimiliano Ungheretti指出，团队当时受到ChatGPT启发，认为这类大型语言模型（LLM）可作为智能座舱的大脑，来协调操控行车大小事。有了大脑，他们还需要「耳、口、手、短期记忆、知识」才能完成驾驶指令，而这5项内核技能，分别对应到自动语音识别、文本转语音、功能／插件／动作、对话状态，以及矢量搜索和检索增强生成（RAG）等技术。

Massimiliano针对最后一项说明，虽然LLM大脑很聪明，但未必具备特定知识，因此他们决定采用RAG方法、而非微调，来更有效率地补足大脑专业知识。

划定这些架构后，团队得先试水温，采用Azure OpenAI服务和其他指令微调过的LLM作为大脑，并搭配提示工程，来验证智能座舱助理概念。他也提到，采用提示工程，「能带来更好的迭代速度，加速产品正式上线。」

步骤1：概念验证

进一步来说，在概念验证（PoC）阶段，TomTom将概念设置为「可用推理行动ReAct提示工程，来将Davinci GPT串接到TomTom服务。」Massimiliano表示，为验证这个概念，他们首先利用微软AI开发平台Azure AI Studio中的游乐场（Playground），来进行测试。

Azure AI Studio平台提供多种模型和API，来供企业尝鲜、测试，在今年大会中还正式上架了强大的多模态模型GPT-4o，以API和模型形式提供，这也是TomTom团队接下来要尝试的模型之一，尤其用来发展更好的语音对话体验。

为打造车用助理，TomTom先是设置内核概念，接着在Azure AI Studio中的游乐场（Playground）来快速测试。可行后，再通过开源LLM开发框架LangChain来实作、迭代。／微软

步骤2：用LangChain开发迭代

回到2023年初，当TomTom在游乐场验证概念后，接着将概念验证结果，利用当时问世没多久的开源LLM开发框架LangChain重现，进而迭代。

在这阶段，他们已将LLM大脑与智能座舱内核技能链接，可实现简单的交互。但「这只在我的机器上运行！」Massimiliano点出，为让这个成果大规模扩展、取得更多回馈以进行更多迭代，他们将应用程序上云。

TomTom揭露智能座舱车用助理的开发流程，首先在游乐场中利用提示工程来测试内核概念，接着使用LLM开发框架LangChain来实作。为取得更多回馈加速迭代，他们将原型App上云，并简化基础设施管理工作。最后，他们将原型App集成至既有服务中，同时也进行各项品质评估、强化安全防护等。／TomTom

步骤3：上云扩大用户

于是，TomTom评估后采用Azure容器应用程序，兼顾上云和无服务器特色，既能让更多人使用智能座舱原型App，团队也只需维护少量基础设施、专注智能座舱助理开发。同时，他们也采用Bicep语言来部署Azure资源，实现基础设施即代码（Infra as Code），简化基础设施管理工作。

同时，在这个阶段，团队还得考量App上云后的记忆和知识存储。于是，他们选用Azure Cosmos DB数据库来存储智能座舱的对话与知识，Massimiliano补充，在知识部分，团队还添加矢量与RAG数据，来补强智能座舱的特定知识。

他还强调，在App中增添语音或文本对话功能，就得考量对话长度增加所带来的性能减退问题，而管理上下文长度、确保输入模型的Token量限制，或采用一些框架来动态剪枝，或保留些时间给对话，都是能兼顾短期记忆和App性能的建议作法。

至于知识部分，因团队采用RAG，也就是搜索知识数据库、将最合适的答案回复给用户。但「最棘手的是如何吸收这些知识，尤其是，如何对大型文档拆分、呈现这些数据给LLM，比如回传给模型前先进行摘要。」Massimiliano表示，这是开发者会面临的另一个挑战。

步骤4：集成准备上线

完成上述步骤后，接下来就是将迭代成果集成至既有服务中，并进行各项品质评估。「这并不容易，」Massimiliano解释，因为LLM可能给出随机回答，若用另一个LLM来检测这个LLM的输出值，则又更加随机。

与此同时，走到这一步的TomTom团队，也开始思考是否要放弃LangChain。但后来回顾，也只是因为当时太早使用了，随着越来越多任务具和配套资源出现，他们并未舍弃这个框架。

在这个阶段，他们也思考，除了短期记忆，应该也要增添整体智能座舱的长期记忆，来达到更好的对话体验。最后，还有一件上线前的必做事项：红队演练与安全防护。

如何进行演练呢？Massimiliano建议，起初可挑一个自动红队框架，并举办一个小型黑客松，来让人组队攻击智能座舱App，再将这些经验纳入自动红队框架中。此外，使用Azure OpenAI或其他框架的审核过滤器等功能，也能强化App保护。

从中学到的2件事

Massimiliano演讲时展示的实测结果，正是完成上述4大步骤的TomTom智能座舱原型App，已成功集成至座车，该原型App也持续优化中。

Massimiliano点出，团队从这段经验，也学到2大重要课题。首先，为跟上快速发展的AI步调，开发者要找出最小可验证的核心概念，来快速迭代、发展许多原型。他表示，开发者甚至可独立于主要App，来验证新概念，再将学习到的知识融入主要App中。接着，开发者要进行无止尽的迭代，因为技术和期望「每天都在变化。」

再来，要确认这些原型是否有价值，就得让原型App接触更多人群、得到使用回馈，才能进一步改善。这时，就得将原本地端的原型转为云端App，采用一些现成云端服务、使用模板，就能快速实现这一点，并专注于内核概念发展、做出差异化。

相关报导