您的位置 首页 kreess

ARM雲服務器技術分析

ARM雲服務器技術分析Arm 不斷增長的雲服務器勢頭Arm 和 RISC-V 等替代架構的價值是引人註目的。Arm 是世界上最流行的處理器架構。很有可能你駕駛的汽車包含多個

ARM雲服務器技術分析

Arm 不斷增長的雲服務器勢頭

Arm 和 RISC-V 等替代架構的價值是引人註目的。

Arm 是世界上最流行的處理器架構。很有可能你駕駛的汽車包含多個隱藏在其中的基於 Arm 的處理器,而你攜帶的手機也有。根據 Mercury Research 的數據,基於 Arm 的處理器占2022 年第四季度售出的所有 PC 的 13%。然而,Arm 取得最大收益的領域是服務器市場,其中公有雲提供商處於領先地位。

最近Liftr Insights的首席執行官 Tab Schadt談到瞭 Arm 在公共雲市場的滲透。Liftr Insights 提供市場上可用的頂級公共雲提供商提供的一些最全面的實例類型跟蹤。Schadt 先生表示,到 2022 年,公共雲中基於 Arm 的產品數量增長瞭 290%,令人難以置信。此外,到 2022 年底,基於 Arm 的實例類型占公共雲產品的比例超過 6%,高於年初為 4.6%。這是一個重要的勢頭。

Arm的業務

雖然 Arm公司控制著 Arm 架構,但該公司實際上並不銷售任何處理器。相反,Arm 公司負責管理架構的演進,並將其技術授權給處理器供應商。Arm 提供多種許可模式。一些供應商將 Arm 的 IP 塊整合到他們的芯片中,而其他供應商則從頭開始實施 Arm 的架構,通過優化來解決問題。

這是一項有利可圖的業務。在最近一個財政季度,Arm Holdings報告的總收入為 7.46 億美元,同比增長 28%。其中大部分收入(4.46 億美元)來自市場上銷售的產品的特許權使用費,而 3 億美元來自許可活動。Arm 的授權業務同比增長 65%。這是令人印象深刻的勢頭。

私募股權公司軟銀集團旗下的 Arm Holdings 計劃在今年晚些時候進行 IPO。首次公開募股計劃是在英偉達收購失敗之後進行的,該收購在幾個國傢的強烈監管阻力後被取消。

Arm的服務器之旅

為瞭在服務器市場找到一席之地,Arm 走過瞭漫長的道路,這一市場充滿瞭失敗的嘗試。Cavium 和 Calxeda 是最早的兩傢基於 Arm 的服務器處理器供應商,他們懷揣著在通用服務器中取代 x86 的宏偉願景。盡管 Cavium 的知識產權已進入 Marvell 的產品,但兩傢公司如今都不復存在。作為一傢獨立公司十年後,Marvell Technology Group 於 2018 年收購瞭 Cavium。SeaMicro 也成為早期潛在的基於 Arm 的服務器供應商,隻是被 AMD 收購並迅速拋棄。

Arm 在服務器領域發展緩慢的原因有很多。例如,早期存在關於軟件兼容性和生態系統支持的有效問題。服務器軟件,包括應用程序和開發工具,直到最近才出現在 Arm 上。二十多年來,企業 IT 團隊一直在部署基於 x86 的服務器,而 Arm 從未參與其中。

Arm 在服務器領域面臨的最大障礙根本不是技術問題。最近采訪瞭的一傢一級服務器制造商的副總裁。這位高管非常坦率地解釋說,構建基於 Arm 的服務器的問題在於它根本無法擴大市場。相反,基於 Arm 的產品取代瞭任何構建服務器的現有產品。那麼為什麼要花錢去做呢?這是一個有效的問題。

Arm在雲端

公共雲服務提供商 (CSP) 與傳統服務器 OEM 有不同的擔憂。Amazon Web Services (AWS) 等 CSP 向 IT 組織銷售可提高效率的業務和運營模型。盡管重要,但與這些公司提供的便利性和靈活性相比,底層服務器技術是次要的。

CSP 最關心的是運營效率。利潤的漲跌取決於運營費用,這是基本的會計準則,但在超大規模數據中心內,運營成本會迅速增加。超大規模運營商最重要的運營支出是與電力和冷卻相關的支出。

例如,微軟公司報告稱,能源成本直接影響其 Azure 雲業務的收入。該公司截至 2022 年 12 月的季度10-Q 文件顯示,其 Azure 毛利率下降瞭約 3 個百分點,主要原因是能源成本上升。

Arm 處理器架構的與眾不同之處在於它能夠以令人難以置信的高能效水平提供高性能。Arm 的能源效率導致該架構在嵌入式和智能手機市場上占據主導地位。能源效率還促使 Apple 將其所有基於 Intel 的產品替換為自己內部設計的基於 Arm 的處理器。因此,能源效率也是 Arm 在雲中的關鍵驅動因素也就不足為奇瞭。

AWS

亞馬遜是第一傢將基於 Arm 的處理器推向市場的公司,盡管它隻向自己出售處理器。AWS 於 2018 年底推出瞭其內部設計的基於 Arm 的處理器 Graviton,此後該公司幾乎每年都發佈新一代 Graviton。AWS Graviton 從三個維度提供價值:成本、能源效率和適合雲原生應用程序的架構。

能效聲明是真實的。例如,NEC Corporation 在 2022 年年中發佈瞭一項研究,表明與類似的基於 x86 的處理器相比,在由 AWS Graviton 處理器提供支持的實例之上構建 5G 核心基礎設施可使功耗降低 72%。這種效率可能會對 AWS 的電力和冷卻費用產生巨大影響;畢竟,亞馬遜並未將能源成本列為影響其 AWS 利潤率的原因。

CSP 的購置成本是另一個關鍵驅動因素。基於 Arm 的處理器比英特爾和 Advanced Micro Devices (AMD) 的同類基於 x86 的產品便宜。部分成本降低來自 Arm 處理器供應商,他們無需承受較大競爭對手臃腫的成本結構。相反,減少的費用會轉給 CSP,CSP 然後將節省的費用轉嫁給他們的客戶。

AWS 通過設計和監督自己的 Graviton 處理器的制造,擁有近乎理想的成本結構。垂直集成處理器開發消除瞭處理器供應商否則會犧牲的所有利潤。AWS 面臨的挑戰從管理處理器的購置成本轉變為管理設計處理器的工程團隊的效率。毫無疑問,亞馬遜是復雜環境中的效率大師。

Graviton 為亞馬遜帶來瞭回報。根據 Liftr Insights 的最新數據,如今基於 Graviton 的實例占 AWS 提供的實例的近 19%,比前一年增加瞭 6%。

安培計算的興起

在亞馬遜證明其 Graviton 產品取得成功後,微軟 Azure 和 Alphabet 的谷歌雲團隊正在開發他們自己的基於 Arm 的競爭產品後,可信的謠言比比皆是。然而,當一傢名為 Ampere Computing 的小型矽公司開始發售其基於 Arm 的服務器處理器時,其中一些謠言開始平息。

Ampere Computing 成立於 2018 年,迅速推出瞭首款基於 Arm 的 Ampere Altra 和 Altra Max 處理器。它的主要客戶是公共雲超大規模。仍然參考來自 Liftr Insights 的數據,Ampere 從 2020 年在公共雲中沒有存在增長到今天近 2% 的公共雲實例類型。

Microsoft Azure 提供瞭最多的基於 Ampere 的實例類型,占基於 Ampere 的實例的 69% 以上。阿裡雲、谷歌雲、Oracle 雲服務和騰訊雲也提供基於安培的實例類型。到目前為止,Ampere Computing 是唯一一傢成功將基於 Arm 的處理器推向服務器市場的供應商。

競爭環境

AWS Graviton 和 Ampere Computing 的 Alta 處理器的成功為進一步的競爭鋪平瞭道路。此外,英偉達預計將在今年晚些時候出貨其首款基於 Arm 的 Grace 服務器級處理器。雖然預計英偉達的 Grace 最初將用於英偉達自己的 DPU 及其 DGX 深度學習產品,但英偉達在更廣泛的市場中有太多機會無法忽視。

來自本土產品的競爭也將加劇。例如,阿裡巴巴已經宣佈將部署其內部設計的倚天 710 處理器,該處理器提供 189 個與 Arm 兼容的 CPU 內核。盡管有 Ampere 的支持,但有關亞馬遜一些最接近的競爭對手仍在進行內部開發的猜測仍在繼續。

具有諷刺意味的是,Arm 進軍服務器領域的道路為更多替代架構鋪平瞭道路。在公共雲生態系統中采用 Arm 表明基於 Arm 的服務器是可行的。IT 組織已將軟件和操作工具鏈調整為與處理器無關。因此,新處理器架構(例如 RISC-V)的進入門檻較低。

RISC-V 不強制支付特許權使用費和許可費,可能會從價值鏈中消除更多利潤。另一方面,RISC-V 不像 Arm 那樣由中央機構控制,因此幾乎無法保證不同 RISC-V 部分之間的互操作性。

這不會阻止市場嘗試。Ventana Microsystems 已計劃通過其 Veyron 處理器將 RISC-V 引入服務器和嵌入式世界。RISC-V 和 Ventana 還為時過早,但請繼續關註兩者。價值主張很強大,Ventana 擁有合適的管理團隊來推動它實現目標。

分析師的看法

基於 Arm 的處理器提供真正的價值。雖然本文重點介紹瞭是什麼讓 Arm 對超大規模用戶具有吸引力,但它大多忽略瞭為 IT 最終客戶提供的引人註目的價值。AWS Graviton、Ampere 的 Altra,甚至英偉達的 Grace,都為雲原生工作負載提供瞭近乎理想的環境。

英特爾和 AMD 共同控制瞭行業中幾乎所有的本地服務器產品和超過 90% 的可用公共雲實例類型。Arm 和 RISC-V 等替代架構的價值是引人註目的,這隻會導致在公共雲和超大規模空間中得到更多采用。

真正的問題是服務器 OEM 是否會將 Arm 交付到他們的本地和即服務產品中。如果像我被告知的那樣,OEM 真的看不到市場擴張機會,那麼 OEM 可能會聽到客戶要求基於 Arm 的服務器。如今幾乎每個企業都有 ESG 擔憂,基於 Arm 的服務器將有助於緩解這些擔憂,同時悄悄提供所需的性能。

關於綠色計算產業聯盟

自2016年成立以來,綠色計算產業聯盟以協同構建綠色、開放、自主、共享生態體系為目標,致力於推動綠色計算產業發展,建設產業交流與合作平臺,以促進企業在PC、服務器、存儲、操作系統、數據庫等領域提升,推動在計算領域的合作共贏。目前已經成為擁有包括鯤鵬、飛騰、Ampere、Marvell等全球最完整的Arm基礎架構服務器芯片夥伴的全球聯盟。

從v8到v9,Arm服務器發展之路

ARM:3A大作將 CPU 的設計與制造相分離的代工模式,給 AMD 提供瞭高度的靈活性。第二、三代 EPYC 處理器可以相對自由的選擇不同的制程來匹配芯片設計的具體需求,客觀上起到瞭幫助 AMD“以小博大”,從英特爾手中持續搶下市場份額的作用。不過,這個靈活性的獲益者更多在於 AMD 自身。超大規模用戶如 AWS 和阿裡雲不滿足於主要調整核心數、運行頻率和 TDP 等指標的傳統定制,希望對 CPU 設計有更多的自主權;又或者,新興 CPU 供應商如 Ampere(安晟培)要選擇適用的技術路線……Arm 幾乎是服務器 CPU 市場上唯一的答案。如果說臺積電幫助解決 CPU 的制造問題,那麼 Arm 幫助解決 CPU 的設計問題。

Cortex 孵化 Neoverse對亞馬遜(Annapurna Labs)、阿裡巴巴(平頭哥)和 Ampere 這有足夠芯片設計能力的“3A”客戶來說,Arm 的 Neoverse 平臺提供瞭設計一款服務器 CPU 的基礎,包括 CPU 核心的微架構和配套的制程。Arm 對服務器 CPU 市場的正面進攻可以回溯到 2011 年 10 月,Arm 發佈加入可選 64 位架構(AArch64)的 ARMv8-A。一年後,Arm 發佈實現 ARMv8-A 64 位指令集的微架構 Cortex-A53 和 Cortex-A57,AMD 表態將推出相應的服務器產品——後者多年的服務器市場經驗正是當時的 Arm 陣營所稀缺的。此後的幾年中,芯片供應商如 Cavium、高通(Qualcomm)和國內的華芯通,超大規模用戶如微軟,都曾積極的推動 64 位 Arm 進入數據中心市場。但是,真正比較成規模化的部署,應當始自 2018 年 11 月 AWS 預覽其首個 Arm 服務器 CPU —— Graviton。Graviton 基於 2015 年推出的 Cortex-A72(A57 的繼任者),16nm 制程,16 核、16 線程, 與同時期的 x86 服務器 CPU 比起來,頗有些‘“平平無奇”,最大的仰仗是亞馬遜“自傢的孩子”,可以充分優化。Cortex-A 傢族已經是 Cortex 三兄弟裡最追求性能的瞭,但畢竟不是面向服務器平臺的產品,不能放寬功耗限制去飆性能。於是,在Graviton 公開之前一個月,Arm 發佈瞭面向雲計算和邊緣基礎設施的 Neoverse 平臺,起點便是 16nm 的 A72 和 A75,代號 Cosmos。

△ Neoverse可伸縮計算平臺僅僅 4 個月之後,2019 年 2 月,Arm 更新瞭 Neoverse 平臺的路線圖,推出 7nm 的 Neoverse N1,性能比之前的目標又有 30% 以上的提升。代號 Ares 的 Neoverse N1,基礎是 2018 年推出的 Cortex-A76,兩者的流水線結構相同, 均為 11 級短流水線設計,前端都是 4 寬的讀 取 / 解碼器。Arm 將其稱為“手風琴”管道,因為根據指令長度不 同,它可以在延遲敏感的情況下將第二預測階段與第一獲取階段重 疊,將調度階段與第一發佈階段重疊,將流水線長度減少到 9 級。L2 Cache 也新增可選的 1MiB 容量,是 A76 的 2 倍。

△ 4 vCPU 配置,Neoverse N1 相對 Cortex-A72的整數性能提升相較於上一代的 A72 平臺,Neoverse N1 平臺帶來瞭顯著的性能提升, 許多項目的成績翻倍,尤其是在標志性的機器學習項目中,成績接 近上一代產品的 5 倍。雖然 A72 的年頭早瞭點兒,但這樣的性能差 距也說明 Neoverse N1 確實有瞭質的飛躍。Graviton2 與 Altra 系列Neoverse N1 平臺帶給數據中心市場的沖擊很大,因為所有人都看 到瞭它的巨大潛力和價值,以及這背後的機會。如果說之前的 A72 還隻是在數據中心市場嶄露頭角的話,那麼 Neoverse N1 則讓更多 人相信 Arm 有能力在這個領域分一杯羹。兩款分別來自雲服務商和獨立 CPU 供應商的 7nm CPU,都基於 Neoverse N1。

2019 年 11 月,AWS 官宣 Graviton2 處理器:

· 核數暴漲至 64,是一代的 4 倍;

· 晶體管數更有 6 倍,達到 300 億之多;

· 64MiB L2 Cache,是一代的 8 倍;

· DDR4-3200 內存接口,(頻率)是一代的 2 倍;

· 運行頻率 2.5GHz,略高於一代的 2.3GHz。

△ 2020 年 AWS 新增的 EC2 實例中, Gravtion2 占據半壁江山, Intel 和 AMD 的比例也耐人尋味基於 Graviton2 的 EC2(Elastic Compute Cloud,彈 性 計 算 雲)實 例類型迅速增多,包括但不限於通用型(M6g、T4g)、計算優化 型(C6g)、內存優化型(R6g、X2gd),部署的區域(Region)和數量也從 2020 年中起穩定增長——據統計,2020 年全年,AWS EC2 實例增量中的 49% 基於 AWS Graviton2。

Armv9:繼往開來2011 年 11 月公佈的 Armv8,將 Arm 帶入瞭 64 位時代。在 Arm 與生態合作夥伴的共同努力下,經過數次產品迭代,Arm 陣營用瞭十年的時間,在服務器市場站穩瞭腳跟。

2021 年 3 月底,Armv9 發佈,在 Armv8 的基礎上,著重升級瞭安全性、 機器學習(Machine Learing,ML)和數字信號處理(Digital Signal Processing,DSP)方面的能力。在新架構所帶來的三大特性中,機器學習或許是大眾最熟悉也是最關心的內容。伴隨著異構應用的崛起,以機器學習為代表的人工智能(Artificial Intelligence,AI)技術已經深入我們生活的方方面面,無論是在後端的數據中心還是在終端、邊緣側,機器學習都大有用武之地。為瞭更好地提升 AI 和 DSP 所需的算力,ARMv9 將原本支持的可伸縮矢量擴展(Scalable Vector Extension,SVE)升級到瞭 2.0 版本。這項技術可以改善機器學習和數字信號處理應用的性能表現,有助於對 5G 系統、VR/AR、機器學習等一系列工作負載的處理。SVE2 提供瞭可調節的向量(Vector,矢量)大小,范圍從 128b(bit, 位)到 2048b,從而允許向量的可變粒度為 128b,這種變化並不會受到硬件平臺的影響。這就意味著,軟件開發人員將隻需要編譯一次其代碼,就可以適用於 Armv9 乃至於後續產品中,實現“編寫一次,到處運行”。同樣,相同的代碼將能夠在具有較低硬件執行寬度能力的更保守的設計上運行,這對於 Arm 設計從物聯網、移動到數據 中心的 CPU 而言至關重要。SVE2 擴展還增加瞭壓縮和解壓縮 CPU 核心內的代碼和數據的能力,因為將數據移入和移出芯片的過程耗電很大,盡可能多使用芯片內的數據可以減少這種數據移動,從而降低能耗。更值得一提的是 Confidential Compute Architecture(CCA),中文名稱為機密計算架構,這也是 Arm 本次版本更新最重要的內容。其實安全問題近些年變得愈演愈烈,勒索病毒與黑客攻擊無時無刻不在活動。面對層出不窮的網絡攻擊問題,既需要網絡服務商、軟件公司的努力,也需要包括 Arm 在內的硬件基礎設施提供商從源頭上封堵可能存在的漏洞,就促成瞭 CCA 的出現。這是一種基於架構層面的安全防護能力,通過打造基於硬件的安全運行環境來執行計算,保護部分代碼和數據,免於被存取或修改,乃至不受特權軟件的影響。

△ Arm 機密計算架構(左),Android 11 和 OpenSUSE 引入的內存標簽擴展技術(右)為此 CCA 引入瞭動態創建機密領域(Realms)的概念——這是一個安全的容器化執行環境,支持安全的數據操作,可將數據與 hypervisor 或操作系統隔離。Hypervisor 的管理功能由“領域管理器” (realms manager)承擔,而 hypervisor 本身隻負責調度和資源分配。使用“領域”的優勢在於極大地減少瞭在設備上運行給定應用程序的信任鏈,操作系統在很大程度上對安全問題變得透明,也允許需要監督控制的關鍵任務應用程序能夠在任何設備上運行。

在實際應用中,內存是非常容易被攻擊的一環,內存安全也一直成為行業的關註點,如何在內存安全漏洞被利用之前就能發現問題,是提高全球軟件安全的重要一步。為此,Arm 與 Google 持續合作開發的“內存標簽擴展”(MTE)技術也成為 Armv9 的一個組成部分,可在軟件中查找內存的空間和時間安全問題,將指向內存的指針和標簽建立聯系,並在使用指針時檢查這個標簽是否正確。如果存取超過范圍,標簽檢查就會失敗,從而可以在第一時間發現內存安全漏洞並進行封堵。

Arm架構升級,v9與v8版本有何差異?

在過去多年裡,Arm對ISA進行瞭改進,也對體系結構進行瞭各種更新和擴展。當中一些可能很重要,有些可能也是一瞥而過。

近日,作為Arm的Vision Day活動的一部分,該公司正式發佈瞭該公司的新一代Armv9架構的首個細節,為Arm未來十年內成為下一個3000億芯片的計算平臺奠定瞭基礎。

讀者可能會問的一個大問題是,Armv9與Armv8究竟有何不同,能讓架構獲得如此大的提升。確實,從純粹的ISA角度來看,v9可能不像v8相比v7那樣實現根本性的跳躍,後者引入瞭AArch64,一個完全不同的執行模式和指令集,該指令集與AArch32相比具有更大的微體系結構分支,例如擴展寄存器,64位虛擬地址空間和更多改進。Armv9繼續使用AArch64作為基準指令集,但是在其功能上增加瞭一些非常重要的擴展,以保證architecture numbering的增加,並且允許Arm不僅可以獲得對AArch64進行某種軟件重新基準化v9的新功能,還能保持我們多年來在v8上獲得的擴展。Arm認為新架構Armv9有三個主要支柱,即安全性、AI以及改進的矢量和DSP功能。對於v9,安全性是一個非常重要的主題,我們將深入探討新擴展和功能的新細節,但是首先談到的DSP和AI功能應該很簡單。

新的Armv9兼容CPU所承諾的最大的新功能可能是開發人員和用戶可以立即看到的——SVE2作為NEON的後繼產品。可伸縮矢量擴展(SVE)的於2016年首次亮相,並首次在富士通的A64FX CPU內核中實現,該芯片已為日本排名第一的超級計算機Fukagu提供支持。SVE的問題在於,新的可變矢量長度SIMD指令集的第一次迭代的范圍相當有限,並且更多地針對HPC工作負載,缺少瞭許多仍由NEON涵蓋的更通用的指令。SVE2於2019年4月發佈,旨在通過用所需指令補充新的可擴展SIMD指令集來解決此問題,以服務於類似DSP等目前仍在使用NEON的工作負載。

除瞭增加的各種現代SIMD功能外,SVE和SVE2的優勢還在於其可變的向量大小,范圍覆蓋瞭128b到2048b,讓其無論在什麼硬件運行,都允許向量的可變粒度為128b。如果純粹從向量處理和編程的角度來看,這意味著軟件開發人員將隻需要編譯一次其代碼,並且如果將來某個CPU帶有本地的512b SIMD execution pipelines,該代碼將能夠充分利用單元的整個寬度。同樣,相同的代碼將能夠在具有較低硬件執行寬度能力的保守設計上運行,這對於Arm設計從物聯網、移動到數據中心的CPU而言至關重要。在保留Arm體系結構的32b編碼空間的同時,它還可以完成所有這些工作。然而類似X86這樣的架構則需要根據矢量尺寸增加新的指令和擴展。

機器學習也被視為Armv9的重要組成部分,因為Arm認為在未來幾年中,越來越多的ML工作負載將變得司空見慣,當中包括瞭對性能或電源效率有至關重要要求的場景中。那就讓在專用加速器上運行ML工作負載變成長久的需要,與此同時,我們還會繼續在CPU上運行較小范圍的ML工作負載。矩陣乘法指令(Matrix multiplication instructions )是此處的關鍵,它將代表生態系統中將更大范圍采用v9 CPU作為基本功能所邁出的重要一步。通常,我認為SVE2可能是保證升級到v9的最重要因素,因為它是更確定的ISA功能,可以在日常使用中與v8 CPU區別開來,並且可以保證軟件生態系統能夠正常運行,這與現有的v8堆棧有所不同。對於服務器領域的Arm來說,這實際上已經成為一個相當大的問題,因為軟件生態系統仍在基於v8.0的軟件包基礎上,不幸的是,該軟件包缺少瞭最重要的v8.1大型系統擴展。使整個軟件生態系統向前發展,並假設新的v9硬件具有新的體系結構擴展功能,這將有助於推動事情發展,並可能解決某些當前情況。但是,v9不僅涉及SVE2和新指令,它還非常註重安全性,在安全性方面我們將看到一些更根本的變化。

介紹機密的計算架構

在過去的幾年中,安全性和硬件安全性漏洞已成為芯片行業的頭等大事,Spectre,Meltdown等漏洞的出現及其所有同級邊信道攻擊都表明,重新思考如何保證安全成為瞭一個基本需求。Arm希望用來解決這一總體問題的方法是通過引入Arm機密計算體系結構(Arm Confidential Compute Architecture:CAA)來重新設計安全應用程序的工作方式。

在繼續之前,我想提箱一下,今天的披露僅僅是對新CCA運作方式的高層次解釋,Arm說,有關新安全機制的確切工作原理的更多細節將在今年夏天的晚些時候公佈。

CCA的目標是從當前的軟件堆棧情況中獲得更大的收益,在當前的軟件堆棧情況下,在設備上運行的應用程序必須固有地信任它們所運行的操作系統和虛擬機管理程序。傳統的安全模型是基於以下事實建立的:更高特權的軟件層被允許查看較低層的執行,然而當操作系統或系統管理程序被以任何方式損害時,這就可能成為瞭一個問題。CCA引入瞭動態創建““realms”的新概念,可以將其視為對OS或虛擬機管理程序完全不透明的安全容器化執行環境。系統管理程序將仍然存在,但僅負責調度和資源分配。而“realm”將由稱為“ealm manager”的新實體管理,其被認為是一段新的代碼,大致大小約為hypervisor的1/10。realm內的應用程序將能夠“證明”領域管理器以確定其是否可信任,這對於傳統的虛擬機管理程序而言是不可能的。

Arm並沒有深入探討究竟是什麼造成瞭realm與操作系統和虛擬機管理程序的非安全世界之間的這種隔離,但聽起來確實像硬件支持的地址空間,但它們無法相互交互。

使用realms的優勢在於,它極大地減少瞭設備上運行的給定應用程序的信任鏈,並且OS對安全性問題變得越來越透明。與當今需要企業或企業使用帶有授權軟件堆棧的專用設備的情況相反,需要監督控制的關鍵任務應用程序將能夠在任何設備上運行。

MTE(memory tagging extensions)並不是v9的新功能,而是隨v8.5一起引入的,MTE或內存標記擴展旨在幫助解決世界軟件中兩個最持久的安全問題。緩沖區溢出(Buffers overflows)和無用後使用(use-after-free)是持續的軟件設計問題,在過去的50年中,這些問題一直是軟件設計的一部分,並且可能需要花費數年的時間才能對其進行識別或解決。MTE旨在通過在分配時標記指針並在使用時進行檢查來幫助識別此類問題。

未來的Arm CPU路線圖這與v9沒有直接關系,但是與即將到來的v9設計的技術路線圖緊密相關,Arm還談到瞭有關他們在未來2年中對v9設計的預期性能的一些觀點。Arm談到瞭移動市場在今年如何將帶有X1的設備性能提升瞭2.4倍(此處我們僅指ISO流程設計的IPC),該性能是幾年前推出的Cortex-A73的兩倍。有趣的是,Arm還談到瞭Neoverse V1設計及其如何達到A72類似設計性能的2.4倍,並透露他們期待著他今年晚些時候發佈的首批V1設備。對於代號為“ Matterhorn”和“ Makalu”的下一代移動IP內核,該公司公開瞭這兩代產品的合計預期IPC增益為30%,其中不包括SoC設計人員可以獲得的頻率或任何其他其他性能增益。這實際上代表著這兩種新設計的世代增加瞭14%,並且如幻燈片中的性能曲線所示,這表明相對於自A76以來Arm在過去幾年所管理的工作而言,改進的步伐正在放緩。不過,該公司指出,進步速度仍然遠遠超過行業平均水平。但潭門也坦言,這被一些行業參與者拖累瞭。Arm還提供瞭一張很有意思的幻燈片,該幻燈片旨在關註系統側對性能的影響,而不僅僅是CPU IP性能。從這裡提供的一些數據可以看到,例如每5ns的內存延遲中有1%的性能,這是我們現在已經廣泛討論瞭幾代的數字,但是Arm在這裡還指出,排除瞭是否通過改善內存路徑,增加緩存或優化頻率功能來改善實現的其他各個方面,他們可以使用整整一代的CPU性能提升,我認為這是對SoC供應商當前保守方法的一種評價,這些方法沒有充分利用X1內核的預期性能餘量,並且隨後也未達到新內核的預期性能預測。Arm繼續將CPU視為未來最通用的計算模塊。盡管專用的加速器或GPU將會占有一席之地,但它們很難解決一些重要問題,例如可編程性,保護性,普遍性(本質上是在任何設備上運行它們的能力)以及經過驗證的正常工作的能力。當前,計算生態系統在運行方式上極為分散,不僅設備類型不同,而且設備供應商和操作系統也不同。

SVE2和Matrix乘法可以極大地簡化軟件生態系統,並允許計算工作負載以更統一的方法向前邁進,該方法將來將可以在任何設備上運行。最後,Arm還分享瞭有關Mali GPU未來的新信息,並透露該公司正在開發VRS等新技術,尤其是Ray Tracing。這一點令人非常令人驚訝,也表明AMD和Nvidia引入RT推動的臺式機和控制臺生態系統也有望將移動GPU生態系統推向RT。

Armv9設計即將在2022年初面世今天的公告以一種非常高級的形式出現,我們希望Arm在接下來的幾個月中,在公司通常的年度技術披露中,更多地談論Armv9的各種細節和新功能,例如CCA。總的來說,Armv9似乎是更基本的ISA轉變(可以看作SVE2)與軟件生態系統的總體重新基準的結合,以匯總v8擴展的最後十年,並為下一個十年奠定基礎Arm體系結構。Arm於去年下半年已經談論過Neoverse V1和N2,我確實希望N2至少最終是基於v9而設計發佈的。Arm進一步透露,更多基於Armv9的 CPU設計(可能是移動端Cortex-A78和X1的後續產品)將於今年推出,而新的CPU可能已經被通常的SoC供應商所采用,並且有望成為在2022年初在商用設備中出現。

參考文獻鏈接

https://mp.weixin.qq.com/s/m5cQQ1de6pWkTamVWydTYw

https://mp.weixin.qq.com/s/0hu6PfvFpTo49AQUn8skEw

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部