就在OpenAI發表低延遲的GPT-4o即時API服務後,微軟隨後更新Azure OpenAI服務,推出了低延遲GPT-4o模型API公開預覽,支援即時語音與音訊互動,適用於即時互動的場景,如客戶支援、語音助理和即時語音翻譯。
GPT-4o即時API是Azure OpenAI的GPT-4o模型系列之一,透過API,企業可以直接將其整合到內部應用程式,支援低延遲語音輸入和輸出,打造出更自然的語音對話應用程式。該模型提升語音回應速度,減少延遲並提供更流暢的互動體驗。API支援多語言對話,可廣泛應用於客服助理、內容創作和即時音訊翻譯等領域。
該版本的GPT-4o模型初期僅在美國東部和瑞典中部地區推出。目前,德國Bosch已採用此模型,用於汽車環境中的虛擬實境培訓,能接收語音指導指令。
GCP 機密運算
Google Cloud更新機密運算產品線,推出C3和C3D兩款VM機密運算服務
Google Cloud近日更新機密運算產品線,正式推出C3和C3D兩款Google Cloud機密VM(Confidential VMs)服務,前者採用的處理器是英特爾第4代Intel Xeon處理器,內建TDX虛擬機硬體隔離技術,後者則是AMD第4代EPYC,內建SEV安全加密虛擬化技術,藉此強化對運算基礎架構的安全防護。
相較前一版本,新的機密運算執行個體服務C3,採用AMX指令集擴展架構內建CPU加速,可加速AI和ML工作負載。此外,利用TDX技術,新版本上也能整合通用加密運算平臺Anjuna Seaglass與Google Cloud機密VM。
另一方面,採用了AMD SEV技術的C3D,不只使用硬體的記憶體加密來加強資料機密性,還可以在性能更強的硬體上執行,並能結合Google Titanium硬體提升處理效能。
目前C3D執行個體服務已推出,而C3則先在亞洲、美國和歐洲部分區域推出。
Azure 虛擬機器
配備141GB的HBM記憶體,Azure最新AI超級運算最佳化虛擬機器亮相
微軟 Azure 近日推出 AI 超級運算最佳化虛擬機器 ND H200 v5,具備更大 HBM 容量,支援更高訓練樣本數,並提升GPU利用率與吞吐量,可用於大型語言模型 (LLM)和小語言模型 (SLM) 的推理工作負載。
與上一代ND H100 v5 相比,Azure ND H200 v5配備8個Nvidia H200 Tensor Core GPU,不只運算效能更強,HBM記憶體也增加了 76%,達到141GB,頻寬提升 43%達到4.8 TB/s,能更快地存取模型參數,降低應用程式延遲。新款VM還能在單一VM的記憶體中存取更複雜的LLM,而不需要分散在多個VM上執行。
此外,在設計上,ND H200 v5可以更有效地管理模型權重、鍵值快取和訓練樣本的GPU記憶體,提升 GenAI 推理工作負載的吞吐量、延遲及成本效率。微軟指出,該版本在執行LLAMA 3.1 405B模型的推理工作時,吞吐量比前一代提升 35%。
ND H200 v5也預先整合多項服務,包括 Azure Batch、Azure Kubernetes 服務、Azure OpenAI 服務和Azure機器學習,讓企業可快速部署應用。
Vodafone Google Cloud
英國電信商Vodafone與Google擴大聯手,未來10年將在非洲和歐洲大推雲端服務和GenAI
英國跨國電信商Vodafone與Google近日宣布將簽署一項總值10億美元、為期 10 年的戰略合作協議,在此合作下,Vodafone將為非洲和歐洲客戶提供Google cloud雲端服務和Gemini生成式服務,進一步推動這些地區的數位轉型與應用創新。
Vodafone和Google合作的首要重點是幫助企業和消費端行動用戶導入最新的硬體,如Google Pixel設備,和AI及雲端應用程式在內的數位技術。
Vodafone計畫2025年先在歐洲少部分國家推出Google One AI Premium 訂閱計畫,讓企業用戶將能夠使用Google生成式 AI 平臺Gemini Advanced,應用於內部系統,並提供視覺、文字及音訊等功能支援。
在安全上,Vodafone將利用Google雲端安全營運平臺為其企業客戶開發新的雲原生安全服務。
/微軟
更多Cloud動態
1.本土車廠納智捷採用Google生成式AI模型Gemini打造AI智能客服系統
2.微軟雲端資料庫服務AlloyDB的ScaNN向量索引功能現已推出,支援最多10億個向量執行搜索
3.甲骨文將砸65億美元在馬來西亞擴大投資雲端運算與AI
4.Arduino Cloud雲端物聯網平臺正式上架AWS市集
:iThome整理,2024年10月



2024-10-11
