賦能生成式AI實(shí)現(xiàn)規(guī)模化擴(kuò)展,終端側(cè)AI有何魔力?
隨著大模型AI的爆火,以ChatGPT為代表的各類(lèi)應(yīng)用開(kāi)始走進(jìn)人們的生活和工作之中。特別是對(duì)于普通用戶(hù)來(lái)說(shuō),生成式AI應(yīng)用降低了不少領(lǐng)域的入門(mén)門(mén)檻,為用戶(hù)嘗試和挑戰(zhàn)更專(zhuān)業(yè)的創(chuàng)作提供了可能。
就像繪畫(huà)一樣,很多人小時(shí)候都有一個(gè)成為畫(huà)家的夢(mèng)想,最后卻發(fā)現(xiàn),現(xiàn)實(shí)只是對(duì)著大佬作品喊“666”。某種程度上說(shuō),生成式AI應(yīng)用的到來(lái)正在幫助我們圓夢(mèng),你不需要刻苦訓(xùn)練畫(huà)技和筆法,也不需要對(duì)專(zhuān)業(yè)有任何理論上的積累,只需要簡(jiǎn)單的文字描述,就能立馬創(chuàng)作出你想要的AI作品。
除此之外,你甚至還能讓AI幫你創(chuàng)作小說(shuō),生成圖表,編寫(xiě)腳本,撰寫(xiě)程序……在以前看來(lái),里面多多少少還有些科幻色彩,但如今看來(lái)卻是如此真實(shí)。
生成式AI應(yīng)用拓展難點(diǎn)何在?
無(wú)論如何,生成式AI應(yīng)用前景廣闊,普及也只是時(shí)間問(wèn)題。不過(guò)從眼下來(lái)看,想要做到規(guī)模化拓展還存在不少難點(diǎn)。
從廠商角度來(lái)看,大模型的訓(xùn)練和使用確實(shí)具有很大的挑戰(zhàn)性,除了要面對(duì)隱私問(wèn)題、算力需求、場(chǎng)景碎片化、缺乏可解釋性等問(wèn)題的困擾外,首當(dāng)其沖就是成本難題。
此前就曾有外媒報(bào)道,作為過(guò)去幾個(gè)月增長(zhǎng)最快的人工智能平臺(tái),ChatGPT每天的成本就達(dá)到了近70萬(wàn)美元,盡管OpenAI試圖將GPT 3.5和GPT 4商業(yè)化,但至今仍未實(shí)現(xiàn)盈虧平衡。如果這種狀況沒(méi)有改觀,那么從長(zhǎng)遠(yuǎn)看,ChatGPT的前景確實(shí)談不上樂(lè)觀。
事實(shí)上,訓(xùn)練大型語(yǔ)言模型需要大量的計(jì)算資源,像大家熟知的GPU,在加速數(shù)據(jù)處理和模型訓(xùn)練的過(guò)程中,GPU的并行計(jì)算能力將會(huì)帶來(lái)顯著優(yōu)勢(shì),同理還有CPU和內(nèi)存,這些硬件資源對(duì)于訓(xùn)練大型語(yǔ)言模型同樣重要。注意,這里說(shuō)的是“大量”,如果只是很少量的資源,使用大型語(yǔ)言模型就會(huì)受到限制。
如果說(shuō),大型生成式AI模型預(yù)計(jì)每年僅需訓(xùn)練幾次,成本尚可接受,但隨著用戶(hù)人數(shù)的增加,以及用戶(hù)訪問(wèn)次數(shù)的增多,數(shù)據(jù)獲取和處理、模型訓(xùn)練、模型部署以及優(yōu)化的費(fèi)用都會(huì)隨之增加,此外人數(shù)多了,模型復(fù)雜度也會(huì)提升,而使用云端推理的成本也會(huì)居高不下。
可以預(yù)見(jiàn),當(dāng)一個(gè)生成式AI應(yīng)用使用的人數(shù)越多,那么維護(hù)它成本也就越昂貴,對(duì)于廠商來(lái)說(shuō),能否堅(jiān)持下去確實(shí)是個(gè)未知數(shù)。
終端側(cè)AI發(fā)展的有哪些優(yōu)勢(shì)?
一般來(lái)說(shuō),為了實(shí)現(xiàn)規(guī)模化擴(kuò)展,需要在提高使用效率和降低維護(hù)成本方面進(jìn)行技術(shù)創(chuàng)新和優(yōu)化。比如針對(duì)模型本身進(jìn)行優(yōu)化,通過(guò)降低模型的復(fù)雜度,從而降低對(duì)計(jì)算資源的需求,或者推動(dòng)大模型AI在云端和終端側(cè)同時(shí)發(fā)展,充分利用各自的優(yōu)勢(shì),滿(mǎn)足不同的需求。
我們知道,過(guò)去很多生成式AI應(yīng)用都跑在云端,一方面,云端平臺(tái)可以提供大規(guī)模分布式計(jì)算資源和高速內(nèi)存,同時(shí)也可以提供大規(guī)模的存儲(chǔ)和計(jì)算資源,對(duì)處理大規(guī)模數(shù)據(jù)有優(yōu)勢(shì)。
但考慮到不同場(chǎng)景需求,大模型AI不一定非要在云端運(yùn)行,在一些特定場(chǎng)景下,在終端側(cè)運(yùn)行大模型AI,可以減少數(shù)據(jù)向云端的傳輸,用戶(hù)掌控自己的數(shù)據(jù),從而降低數(shù)據(jù)泄露的風(fēng)險(xiǎn),更利于隱私保護(hù)。
另外,因?yàn)椴恍枰?jīng)過(guò)云端處理數(shù)據(jù),在執(zhí)行特定需求時(shí),在終端側(cè)運(yùn)行大模型AI能夠快速響應(yīng)用戶(hù)的請(qǐng)求。比如在自動(dòng)駕駛場(chǎng)景中,就需要減少?gòu)臄?shù)據(jù)輸入到?jīng)Q策輸出的時(shí)間。而在網(wǎng)絡(luò)環(huán)境不穩(wěn)定的區(qū)域,訪問(wèn)云端較慢也會(huì)極大影響用戶(hù)體驗(yàn)。顯然面對(duì)此類(lèi)場(chǎng)景,計(jì)算任務(wù)還是放在終端運(yùn)行更為合適。
當(dāng)然還有更關(guān)鍵的一點(diǎn),云端計(jì)算需要消耗大量的資源和能源,而終端側(cè)AI可以高效利用本地資源進(jìn)行計(jì)算和數(shù)據(jù)處理,從而大大降低對(duì)云端的依賴(lài),利于節(jié)省成本和節(jié)約能源。總之,終端側(cè)AI的優(yōu)勢(shì)很明顯,一旦完全鋪開(kāi),將會(huì)成為大模型AI規(guī)模拓展過(guò)程中的重要助力。
誰(shuí)在推動(dòng)終端側(cè)AI的發(fā)展?
眼下,終端側(cè)AI正在呈擴(kuò)大化的發(fā)展趨勢(shì),而高通在其中無(wú)疑扮演了很重要的角色。
高通公司全球副總裁侯明娟致辭
今年9月份,高通發(fā)布了《混合 AI是AI的未來(lái)》白皮書(shū),表達(dá)了高通對(duì)未來(lái)AI技術(shù)發(fā)展的趨勢(shì)的理解和展望,并深入闡述混合AI架構(gòu)的領(lǐng)先優(yōu)勢(shì)。
實(shí)際上,高通技術(shù)方案正在為終端側(cè)AI的廣泛應(yīng)用和快速發(fā)展提供了重要支持和保障。此前,高通通過(guò)開(kāi)發(fā)AI加速架構(gòu)和全棧AI套件,為開(kāi)發(fā)者提供靈活和穩(wěn)健的AI解決方案。這些措施不僅幫助開(kāi)發(fā)者、OEM廠商輕松開(kāi)發(fā)混合AI應(yīng)用,也為用戶(hù)能夠享受AI技術(shù)樂(lè)趣按下了加速鍵。
事實(shí)上,驍龍芯片就是一個(gè)很好例子。驍龍芯片作為移動(dòng)端處理器,具有強(qiáng)大的AI處理能力,最新的第二代驍龍8移動(dòng)平臺(tái)采用了第八代高通AI引擎,其AI性能提高了4.35倍。同時(shí),這款芯片也是首個(gè)支持變革性的INT4 AI精度格式的驍龍移動(dòng)平臺(tái),在持續(xù)AI推理方面能夠?qū)崿F(xiàn)60%的能效提升。可以說(shuō),第二代驍龍8不僅提高了AI應(yīng)用的性能和效率,同時(shí)也為智能手機(jī)運(yùn)行更復(fù)雜的AI應(yīng)用提供了支持。
圖源:@小米手機(jī)微博
目前,小米自研的端側(cè)大模型已經(jīng)在驍龍平臺(tái)跑通,其自研13億參數(shù)端側(cè)大模型的效果,在部分場(chǎng)景上可以媲美行業(yè)60億參數(shù)的云端大模型。
與此同時(shí),高通已經(jīng)實(shí)現(xiàn)了Stable Diffusion和ControlNet在終端側(cè)的運(yùn)行。Stable Diffusion是一個(gè)參數(shù)超過(guò)10億的超大神經(jīng)網(wǎng)絡(luò)基礎(chǔ)模型,能夠基于輸入的文本提示生成圖片。
根據(jù)高通的演示,將手機(jī)設(shè)置成“飛行模式”,再通過(guò)手機(jī)端全棧AI優(yōu)化,這一模型能夠完全在終端側(cè)運(yùn)行,實(shí)現(xiàn)在15秒內(nèi)完成20步推理,最終生成飽含豐富細(xì)節(jié)的圖像。
ControlNet是一種基于生成式AI的神經(jīng)網(wǎng)絡(luò)模型,可以用于智能語(yǔ)音、文本生成和圖像編輯等場(chǎng)景,在智能手機(jī)上運(yùn)行ControlNet,意味著可以在各種場(chǎng)景下實(shí)現(xiàn)更加快速、高效和實(shí)時(shí)的AI計(jì)算和推理,對(duì)于AI大模型在終端側(cè)普及具有深遠(yuǎn)的意義。
最后:
在大熒幕上,科幻影視中的AI機(jī)器人總會(huì)給人留下深刻印象,無(wú)數(shù)觀眾也夢(mèng)想著有朝一日,我們身邊也能擁有這樣一位無(wú)所不能的好助理。
從現(xiàn)實(shí)生活來(lái)看,這樣的想法絕非異想天開(kāi),隨著終端側(cè)AI的廣泛應(yīng)用,未來(lái)移動(dòng)設(shè)備、智能家居、可穿戴設(shè)備和汽車(chē),都將成為運(yùn)行生成式AI應(yīng)用的主要載體。幸運(yùn)的是,這一天看起來(lái)并不遙遠(yuǎn),得益于高通AI技術(shù)和解決方案在終端側(cè)AI發(fā)展中起到的推動(dòng)和引領(lǐng)作用,大量邊緣側(cè)終端已經(jīng)有能力運(yùn)行生成式AI應(yīng)用,未來(lái)隨著終端數(shù)量的增多,也勢(shì)必會(huì)為用戶(hù)帶來(lái)更好的體驗(yàn)和更多的便利。
(8325249)
下一篇:故障指示燈不亮了(如何解決)
- 1麻將機(jī)故障代碼-3(如何解決常見(jiàn)問(wèn)題)。
- 2洗碗機(jī)故障代碼大全(如何識(shí)別和解決常見(jiàn)問(wèn)題)。
- 3pt32700Y板壞怎么維修(維修pt32700Y板壞問(wèn)題)
- 4洗衣離合器維修(如何自行檢修并解決故障)。
- 5羅曼斯指紋鎖維修電話(huà)(羅曼斯指紋鎖維修電話(huà))
- 6海信遙控器壞了怎么修(快速修復(fù):如何解決海信遙控器故障?)
- 7空夢(mèng)保險(xiǎn)柜廠家電話(huà)(空夢(mèng)保險(xiǎn)柜廠家電話(huà):一鍵咨詢(xún),安全可靠)
- 8康佳14時(shí)電視機(jī)故障(康佳14時(shí)電視機(jī)故障分析)
- 9熱水器e3錯(cuò)誤代碼(熱水器E3錯(cuò)誤代碼:解析與排除指南)
- 10空調(diào)外機(jī)5根電線(xiàn)怎么接線(xiàn)圖(詳細(xì)圖解步驟)
-
洗衣機(jī)馬達(dá)怎么試(洗衣機(jī)馬達(dá)測(cè)試方法)
2025-06-07
-
合肥高新區(qū)燃?xì)庠钣蜔煓C(jī)維修(如何自行解決常見(jiàn)故障)
2025-06-07
-
貝格爾空氣源熱泵售后維修電話(huà)(貝格爾空氣源熱泵售后維修電話(huà))
2025-06-07


