免费看无码午夜福利片 ,欧美黑人巨大videos精品男男 ,国产精品美女久久久网av,国产福利精品一区二区,久久综合色老色,天天影视网天天综合色,精品国产丝袜自在线拍国语,东京热男人av天堂
歡迎訪問深圳市中小企業(yè)公共服務(wù)平臺電子信息窗口

Arm 計(jì)算平臺加持,全新 Llama 3.2 LLM實(shí)現(xiàn)AI 推理的全面加速和擴(kuò)展

2024-09-27 來源:Arm
4994

關(guān)鍵詞: Arm Meta Llama 3.2 AI 邊緣側(cè) 合作 開源 小型模型 云端 Kleidi PyTorch CPU 設(shè)備 未來

新聞重點(diǎn):
在 Arm CPU 上運(yùn)行 Meta 最新 Llama 3.2 版本,其云端到邊緣側(cè)的性能均得到顯著提升,這為未來 AI 工作負(fù)載提供了強(qiáng)大支持
Meta 與 Arm 的合作加快了用例的創(chuàng)新速度,例如個(gè)性化的端側(cè)推薦以及日常任務(wù)自動(dòng)化等
Arm 十年來始終積極投資AI領(lǐng)域,并廣泛開展開源合作,為 1B 至 90B 的 LLM 實(shí)現(xiàn)在 Arm 計(jì)算平臺上無縫運(yùn)行
 
人工智能 (AI) 的迅猛發(fā)展意味著大語言模型 (LLM) 的新版本不斷推陳出新。要充分發(fā)揮 AI 的潛力并抓住其帶來的機(jī)遇,需要實(shí)現(xiàn) LLM 從云端到邊緣側(cè)的廣泛部署,而這也伴隨著對計(jì)算和能源需求的大幅增長。整個(gè)生態(tài)系統(tǒng)正攜手尋找應(yīng)對這一挑戰(zhàn)的解決方案,不斷推出新的更加高效的開源 LLM,以便大規(guī)模實(shí)現(xiàn)各種 AI 推理工作負(fù)載,加快為用戶帶來全新、快速的 AI 體驗(yàn)。

為此,Arm與Meta 展開緊密合作,在 Arm CPU 上啟用新的Llama 3.2 LLM,集成開源創(chuàng)新與 Arm 計(jì)算平臺的優(yōu)勢,顯著推進(jìn)了解決AI挑戰(zhàn)的進(jìn)程。得益于Arm 的持續(xù)投資及與新型LLM 的合作, Arm CPU運(yùn)行 AI 的優(yōu)勢在生態(tài)系統(tǒng)中脫穎而出,使Arm成為 AI 推理開發(fā)者的首選平臺。

加速云到邊緣側(cè)的 AI 性能

小型 LLM(如 Llama 3.2 1B 和 3B)能夠支持基于文本的基礎(chǔ)生成式 AI 工作負(fù)載,對于大規(guī)模 AI 推理的實(shí)現(xiàn)至關(guān)重要。通過 Arm CPU 優(yōu)化內(nèi)核在 Arm 技術(shù)驅(qū)動(dòng)的移動(dòng)設(shè)備上運(yùn)行新的 Llama 3.2 3B LLM,可讓提示詞處理速度提高五倍,詞元 (token) 生成速度提高三倍,在生成階段實(shí)現(xiàn)每秒 19.92 個(gè)詞元。這將直接減少了在設(shè)備上處理 AI 工作負(fù)載的延遲,大大提升了用戶整體體驗(yàn)。此外,當(dāng)邊緣側(cè)能處理的 AI 工作負(fù)載越多,往返云端傳輸數(shù)據(jù)所節(jié)省的電量就越多,進(jìn)而節(jié)省了能源和成本。
 
除了在邊緣側(cè)運(yùn)行小型模型,Arm CPU同樣支持在云端運(yùn)行更大的模型(如 Llama 3.2 11B 和 90B)。11B 和 90B 的模型非常適合云端基于 CPU 的推理工作負(fù)載,可生成文本和圖像,其中,在 Arm Neoverse V2 上的測試結(jié)果展現(xiàn)出了更大的性能提升。在基于 Arm 架構(gòu)的 AWS Graviton4 上運(yùn)行 11B 的圖像和文本模型,可以在生成階段實(shí)現(xiàn)每秒 29.3 個(gè)詞元的表現(xiàn),遠(yuǎn)遠(yuǎn)超出了人類大約每秒閱讀五個(gè)詞元的速度。
 
AI 將通過開源創(chuàng)新和生態(tài)系統(tǒng)協(xié)作迅速擴(kuò)展

能公開獲取新的 LLMs(如Llama 3.2)至關(guān)重要。開源創(chuàng)新正以迅猛速度發(fā)展,在之前的版本中,開源社區(qū)在不到 24 小時(shí)的時(shí)間內(nèi)便能在 Arm 上部署并運(yùn)行新的 LLM。
 
Arm將通過 Arm Kleidi 進(jìn)一步支持軟件社區(qū),讓整個(gè) AI 技術(shù)棧能夠充分發(fā)揮這一優(yōu)化的 CPU 性能。Kleidi 可在任何 AI 框架上解鎖 Arm Cortex 和 Neoverse CPU 的 AI 功能和性能,無需應(yīng)用程序開發(fā)者進(jìn)行額外的集成工作。
 
通過最近的 Kleidi 與 PyTorch 集成以及正在推進(jìn)的與 ExecuTorch 集成,Arm正在為基于 Arm CPU的開發(fā)者提供從云端到邊緣側(cè)的無縫 AI 性能。得益于Kleidi 與 PyTorch 的集成,在基于 Arm 架構(gòu)的 AWS Graviton 處理器上運(yùn)行 Llama 3 LLM 的詞元首次響應(yīng)時(shí)間加快了 2.5 倍。

同時(shí),在端側(cè),與參考實(shí)現(xiàn)相比,在 KleidiAI 庫的加持下,使用 llama.cpp庫在新的 Arm Cortex-X925 CPU 上運(yùn)行 Llama 3 的詞元首次響應(yīng)時(shí)間加快了 190%。
 
構(gòu)建 AI 的未來

Arm 與 Meta 的合作成為了行業(yè)合作的新標(biāo)桿,匯聚了 Arm 計(jì)算平臺的靈活性、普及性和 AI 功能,以及 Meta 等行業(yè)巨頭的技術(shù)專長,共同解鎖AI 廣泛應(yīng)用的新機(jī)遇。無論是利用端側(cè) LLM 滿足用戶的個(gè)性化需求,如根據(jù)用戶所處的位置、日程和偏好來執(zhí)行任務(wù),還是通過企業(yè)級應(yīng)用來優(yōu)化工作效率,讓用戶能夠更專注于戰(zhàn)略性任務(wù),Arm 技術(shù)的集成都為未來奠定了基礎(chǔ)。未來,設(shè)備不再只是命令和控制工具,更是能在提升用戶整體體驗(yàn)方面扮演積極的作用。
 
在 Arm CPU 上運(yùn)行 Meta 最新 Llama 3.2 版本,其AI 性能實(shí)現(xiàn)了顯著提升。這類開放式合作是實(shí)現(xiàn)無處不在的 AI 創(chuàng)新、促進(jìn) AI 可持續(xù)發(fā)展的最佳途徑。通過新的 LLM、開源社區(qū)和 Arm 的計(jì)算平臺,Arm 正在構(gòu)建 AI 的未來, 到 2025 年,將有 1000 多億臺基于 Arm 架構(gòu)的設(shè)備支持 AI。

關(guān)于 Arm

Arm 作為業(yè)界性能最強(qiáng)、能效最高的計(jì)算平臺,以無可比擬的規(guī)模,覆蓋全球 100% 的聯(lián)網(wǎng)人群。Arm 提供先進(jìn)的解決方案以滿足對計(jì)算永無止盡的需求,進(jìn)而賦能全球領(lǐng)先的科技公司釋放前所未有的人工智能體驗(yàn)和性能。Arm 攜手全球最廣泛的計(jì)算生態(tài)系統(tǒng)和 2,000 萬軟件開發(fā)者,共同在 Arm 平臺上構(gòu)建人工智能的未來。



主站蜘蛛池模板: 18禁美女裸体爆乳无遮挡| 999在线视频精品免费播放观看 | 无码精油按摩潮喷在播放| 国产手机在线亚洲精品观看| 亚洲欧美日本国产mag| av无码岛国免费动作片| 国产在线精品99一区不卡| 亚洲国色天香卡2卡3卡4| 国产精品自在在线午夜| 婷婷久久香蕉五月综合| 一本一本久久a久久综合精品| 337p日本欧洲亚洲大胆精筑| 亚洲成a人片在线观看无码专区| 免费无码av一区二区波多野结衣| 精品无人区无码乱码大片国产| 亚洲愉拍自拍另类天堂| 中文成人久久久久影院免费观看| 中文激情在线一区二区| 国产传媒18精品免费1区| 日韩精品一区二区av在线| 国产人在线成免费视频| 久久久国产不卡一区二区| 少妇太爽了在线观看免费视频| 特殊重囗味sm在线观看无码| 亚洲国产精品无码专区影院| 四虎永久在线精品免费观看视频 | 亚洲毛片无码专区亚洲a片| 成在人线av无码免费看网站| 国产亚洲精品久久精品69| 欧美日韩国产专区一区二区| 久久一本人碰碰人碰| 国产亚洲精品影视在线| 亚洲日本乱码一区二区产线一∨ | 久久综合九色综合97欧美| 天天av天天爽无码中文| 精品久久久无码中文字幕一丶| 亚洲成av人片无码bt种子下载 | 亚洲人成色在线观看| 亚洲欧洲日产无码中文字幕 | 国产精品露脸视频观看| 青青小草av一区二区三区|