實(shí)時(shí)更新中芯匯金最新動(dòng)態(tài),了解中芯匯金
在快速發(fā)展的人工智能領(lǐng)域,生成式AI無(wú)疑是目前的大熱點(diǎn),也是引領(lǐng)了AI領(lǐng)域潮流的最重要一部分,無(wú)論是其大語(yǔ)言模型、多模態(tài)模型、具身智能,還是通用人工智能等技術(shù),都在不斷推動(dòng)著智能科技的前進(jìn)步伐。
一、統(tǒng)一未來(lái):多模態(tài)模型加速文本、圖像和視頻融合
多模態(tài)模型是指能夠處理不同類(lèi)型數(shù)據(jù)(如視覺(jué)、文本、聽(tīng)覺(jué)等)并將它們?nèi)诤掀饋?lái)進(jìn)行綜合理解的人工智能模型。這種模型能夠更全面地理解和處理真實(shí)世界中復(fù)雜多樣的信息,從而進(jìn)一步提升大型模型的遷移學(xué)習(xí)能力。多模態(tài)技術(shù)的發(fā)展在人工智能領(lǐng)域具有重要意義。
當(dāng)前,單模態(tài)的人工智能模型,如處理文本、語(yǔ)音、圖片等的模型,已經(jīng)相對(duì)成熟。而大型模型正在向多模態(tài)信息融合的方向快速發(fā)展。一些重要的進(jìn)展包括CLIP(Contrastive Language-Image Pretraining)模型的誕生以及GPT-4等模型的圖像處理能力的提升。大型模型不僅限于文字和圖像的處理,也開(kāi)始拓展到音頻、視頻等領(lǐng)域。
未來(lái)展望方面,隨著多模態(tài)技術(shù)的不斷發(fā)展,模型將面臨更加復(fù)雜多樣化的交互場(chǎng)景。多模態(tài)技術(shù)將在智能家居、智慧城市、醫(yī)療診斷、自動(dòng)駕駛等領(lǐng)域打開(kāi)全新的應(yīng)用空間,進(jìn)一步推動(dòng)人工智能的發(fā)展。
二、逾越虛擬邊界:具身智能成為AI發(fā)展新形態(tài)
具身智能是指那些可以感知和與物理世界進(jìn)行交互,具有自主決策和行動(dòng)能力的人工智能系統(tǒng)。這些智能體能夠以主人公的視角感受物理世界,并通過(guò)與環(huán)境的交互結(jié)合自我學(xué)習(xí)來(lái)理解和改變客觀世界。
近年來(lái),具身智能被認(rèn)為是計(jì)算機(jī)視覺(jué)領(lǐng)域的重要發(fā)展方向,被形容為人工智能研究的"北極星"。一些企業(yè)和研究機(jī)構(gòu)推出了具身智能相關(guān)的產(chǎn)品和項(xiàng)目,如谷歌的RoboCat大模型和英偉達(dá)的Nvidia VIMA。
未來(lái)展望方面,通用人工智能和機(jī)器人產(chǎn)業(yè)正處在快速發(fā)展、相互融合促進(jìn)的戰(zhàn)略機(jī)遇期。具身智能作為兩大領(lǐng)域交叉的核心應(yīng)用,有望在未來(lái)取得快速發(fā)展。它將推動(dòng)智能體具備更多自主規(guī)劃、決策、行動(dòng)和執(zhí)行的能力,實(shí)現(xiàn)人工智能的進(jìn)一步進(jìn)階。
三、大模型智慧火花:走向通用人工智能的途徑愈發(fā)明晰,腦機(jī)接口創(chuàng)造新的交互方式
通用人工智能(AGI)是指具備類(lèi)似于人類(lèi)思考能力,能夠適應(yīng)廣泛領(lǐng)域并解決多種問(wèn)題的機(jī)器智能,是人工智能研究的重要目標(biāo)之一。而狹義人工智能則指已取得顯著進(jìn)展但局限于特定領(lǐng)域的人工智能,例如語(yǔ)音識(shí)別、機(jī)器視覺(jué)等。目前我們處于狹義人工智能相對(duì)成熟、通用人工智能乍現(xiàn)的階段,GPT-4等大型自然語(yǔ)言模型被認(rèn)為是通向通用人工智能的重要潛在路徑。OpenAI的CEO薩姆·奧特曼表示,AGI時(shí)代可能很快就會(huì)到來(lái),未來(lái)十年內(nèi)行業(yè)可能會(huì)擁有超強(qiáng)的AI系統(tǒng)。
另一方面,人類(lèi)與人工智能之間的交互方式也在不斷升級(jí),腦機(jī)接口有望成為下一代人機(jī)交互方式。當(dāng)前,腦機(jī)接口技術(shù)正在突破人類(lèi)的生理界限,不僅為殘障人士提供了前所未有的可能性,還有望成為下一代的人機(jī)交互方式。
四、數(shù)據(jù)的力量:海量數(shù)據(jù)帶來(lái)模型能力涌現(xiàn),高質(zhì)量數(shù)據(jù)提升模型性能
深度學(xué)習(xí)的進(jìn)步建立在更大模型處理海量數(shù)據(jù)的基礎(chǔ)上。從GPT-1模型的1.17億參數(shù)到GPT-3的1750億參數(shù),模型的效果取得了顯著突破,并涌現(xiàn)出新的能力。然而,模型參數(shù)量的增加也帶來(lái)了算力需求的激增,模型架構(gòu)和參數(shù)量提升帶來(lái)的收益正逐漸減少。
據(jù)阿伯丁大學(xué)、麻省理工大學(xué)等研究機(jī)構(gòu)的報(bào)告,高質(zhì)量的語(yǔ)言數(shù)據(jù)預(yù)計(jì)在2026年將耗盡,而低質(zhì)量的語(yǔ)言數(shù)據(jù)和圖像數(shù)據(jù)將分別在2030-2050年、2030-2060年間枯竭。
以數(shù)據(jù)為中心的人工智能更加專(zhuān)注于數(shù)據(jù)的價(jià)值,進(jìn)一步推動(dòng)AI模型的性能突破。斯坦福大學(xué)的吳恩達(dá)教授提出了二八定律:80%的數(shù)據(jù)+20%的模型=更好的AI。數(shù)據(jù)中心的策略可以解決數(shù)據(jù)樣本不足、數(shù)據(jù)偏差等問(wèn)題,高質(zhì)量數(shù)據(jù)集成為推動(dòng)模型性能進(jìn)一步提升的關(guān)鍵要素,高質(zhì)量的數(shù)據(jù)處理、數(shù)據(jù)標(biāo)注服務(wù)以及完善的數(shù)據(jù)收集和評(píng)估體系的價(jià)值將進(jìn)一步凸顯。
五、數(shù)據(jù)中心的AI變革:智算中心成為關(guān)鍵基礎(chǔ)設(shè)施
云計(jì)算是當(dāng)前重要的AI算力提供方案,AI服務(wù)器市場(chǎng)獲得迅猛發(fā)展。根據(jù)TrendForce數(shù)據(jù),2022年全球AI服務(wù)器的出貨量約占整體服務(wù)器比重的1%,隨著大型模型訓(xùn)練和推理的需求爆發(fā),AI算力資源需求預(yù)計(jì)將呈指數(shù)增長(zhǎng)。根據(jù)IDC的數(shù)據(jù),未來(lái)5年中國(guó)智能算力規(guī)模的年復(fù)合增長(zhǎng)率將達(dá)到52.3%,全球價(jià)值萬(wàn)億美元的數(shù)據(jù)中心存量市場(chǎng)將從通用計(jì)算逐步過(guò)渡到AI計(jì)算。
云計(jì)算正從以CPU為中心的同構(gòu)計(jì)算架構(gòu)向以CPU+GPU/NPU為中心的異構(gòu)計(jì)算架構(gòu)深度演進(jìn)。預(yù)計(jì),大型模型帶來(lái)的GPU存量空間將從2023年的277億美元上升至2025年的1121億美元,以GPU為代表的AI計(jì)算資源在短期內(nèi)將供不應(yīng)求。
隨著專(zhuān)有領(lǐng)域計(jì)算需求的提升,AI芯片追求更高的性能和更低的功耗,芯片的多樣性和生態(tài)豐富性將不斷提升。一些頭部互聯(lián)網(wǎng)廠商將著力推進(jìn)AI芯片的自主研發(fā),例如谷歌致力于打造專(zhuān)注于深度學(xué)習(xí)的TPU,并不斷豐富其AI生態(tài)布局。
六、大模型C端角色:個(gè)人智能助理與新一代的流量入口
大型語(yǔ)言模型將成為個(gè)人智能助理的關(guān)鍵。目前,大型模型已具備接入互聯(lián)網(wǎng)、進(jìn)行內(nèi)存管理等能力,通過(guò)目標(biāo)任務(wù)自動(dòng)拆分、計(jì)劃制定和計(jì)劃實(shí)施等方式,能夠自主完成用戶(hù)的需求,成為每個(gè)人的智能助理,例如制定旅行計(jì)劃并預(yù)定住宿和餐飲。
大型模型也將成為新一代的流量入口。GPT-4正逐步開(kāi)放插件功能,通過(guò)底層模型連接第三方應(yīng)用,構(gòu)建豐富的生態(tài)系統(tǒng)。自插件功能開(kāi)放以來(lái),GPT-4已接入超過(guò)500個(gè)插件,包括教育、金融等領(lǐng)域。隨著大型模型能力的增強(qiáng)和插件生態(tài)的豐富,大型模型有望成為新一代的人機(jī)交互方式和流量入口。根據(jù)2023年5月的數(shù)據(jù),OpenAI官網(wǎng)訪問(wèn)量為18.6億次,是全球第19名次的互聯(lián)網(wǎng)訪問(wèn)IP。
七、大模型B端應(yīng)用:專(zhuān)業(yè)數(shù)據(jù)與成本驅(qū)動(dòng)行業(yè)模型百花齊放,打開(kāi)廣闊應(yīng)用空間
數(shù)據(jù)壁壘帶來(lái)企業(yè)端大型模型百花齊放。通用大型模型可以幫助用戶(hù)解決一般性問(wèn)題,但當(dāng)企業(yè)需要處理特定行業(yè)的數(shù)據(jù)和任務(wù)時(shí),往往需要對(duì)基本模型進(jìn)行垂直領(lǐng)域的微調(diào)。不同垂直行業(yè)具有不同特性和需求,因此大型模型的應(yīng)用呈現(xiàn)多樣化趨勢(shì)。
B端應(yīng)用出于對(duì)模型經(jīng)濟(jì)性的考量,未來(lái)將呈現(xiàn)階梯式、差異性需求。大型模型在垂直領(lǐng)域的商業(yè)化落地對(duì)模型的運(yùn)行成本更為敏感,需要不同參數(shù)規(guī)模的大型模型組成多層次的產(chǎn)品組合,從而在不同場(chǎng)景下實(shí)現(xiàn)最佳的經(jīng)濟(jì)性,進(jìn)一步提升大型模型的豐富度。
八、大模型輕量化:降低應(yīng)用成本、帶動(dòng)端側(cè)算力發(fā)展
隨著大型模型小型化和場(chǎng)景化需求的增加,同時(shí)出于對(duì)AI應(yīng)用的經(jīng)濟(jì)性、可靠性和安全性的考慮,部分場(chǎng)景的推理將逐步從云端擴(kuò)展到端側(cè),帶動(dòng)端側(cè)算力需求的進(jìn)一步提升。
目前,多個(gè)大型模型都已推出“小型化”和“場(chǎng)景化”版本。例如,谷歌于5月23日發(fā)布的PaLM-2大模型中,最輕量版本“壁虎”可在移動(dòng)端運(yùn)行,運(yùn)行速度快且支持離線操作。其他大型模型也有對(duì)應(yīng)的小參數(shù)版本。
大型模型端側(cè)應(yīng)用布局不斷加速。端側(cè)算力正在快速發(fā)展中,高通通過(guò)量化、編譯和硬件加速進(jìn)行優(yōu)化,使Stable Diffusion能在搭載第二代驍龍8移動(dòng)平臺(tái)的手機(jī)上運(yùn)行。高通在微軟Build2023開(kāi)發(fā)者大會(huì)上展示了最新的端側(cè)AI能力以及在下一代Windows 11上開(kāi)發(fā)生成式AI的工具,并表示未來(lái)幾個(gè)月大型語(yǔ)言模型有望在端側(cè)運(yùn)行。
九、大模型的深遠(yuǎn)影響:重構(gòu)勞動(dòng)力市場(chǎng)、改寫(xiě)科研范式
大語(yǔ)言模型對(duì)勞動(dòng)力市場(chǎng)結(jié)構(gòu)產(chǎn)生了深遠(yuǎn)而復(fù)雜的影響。根據(jù)OpenAI聯(lián)合賓夕法尼亞大學(xué)的研究報(bào)告預(yù)測(cè),約80%的美國(guó)勞動(dòng)力可能有至少10%的工作受到大語(yǔ)言模型的影響。
大語(yǔ)言模型的應(yīng)用帶來(lái)了勞動(dòng)力市場(chǎng)結(jié)構(gòu)的調(diào)整和變化。短期內(nèi),大語(yǔ)言模型可能替代部分低技能或重復(fù)性工作。中期來(lái)看,大語(yǔ)言模型也將創(chuàng)造新的與人工智能相關(guān)的就業(yè)機(jī)會(huì)。長(zhǎng)期來(lái)看,大語(yǔ)言模型的應(yīng)用將深刻改變各行業(yè)的工作模式和商業(yè)模式,讓企業(yè)的組織架構(gòu)更加扁平化和小型化。在這個(gè)過(guò)程中,需要個(gè)人和企業(yè)積極適應(yīng),發(fā)展人類(lèi)獨(dú)有的創(chuàng)新、協(xié)作和社交等能力,與人工智能共同進(jìn)化。
此外,AI與前沿科學(xué)的結(jié)合展現(xiàn)出巨大潛力,可顯著降低前沿科技研究中的智力成本并提升研究效率。生命科學(xué)、氣象預(yù)測(cè)、數(shù)學(xué)、分子動(dòng)力學(xué)等前沿科學(xué)領(lǐng)域均得到了人工智能的廣泛助力,AI for Science將帶來(lái)科研范式的變革和新的產(chǎn)業(yè)形態(tài)。
十、AI治理與技術(shù)的平衡:AI可解釋性亟待增強(qiáng),監(jiān)管緊迫性日益凸顯
在人工智能的快速發(fā)展中,加強(qiáng)AI監(jiān)管與推動(dòng)AI技術(shù)進(jìn)步同等重要。人工智能的能力帶來(lái)了應(yīng)用的便利性,但同時(shí)也可能引發(fā)數(shù)據(jù)隱私、算法偏見(jiàn)、AI倫理等一系列問(wèn)題。
從技術(shù)角度來(lái)看,可以通過(guò)可解釋AI等技術(shù)手段增強(qiáng)AI的可信度。可解釋AI使人工智能的決策過(guò)程透明化,增加輸出內(nèi)容的可理解性和可信任度,對(duì)于構(gòu)建用戶(hù)對(duì)AI系統(tǒng)的信任、提升系統(tǒng)的有效性以及應(yīng)對(duì)潛在的倫理問(wèn)題都至關(guān)重要。
從規(guī)范角度來(lái)看,各國(guó)政府已經(jīng)開(kāi)始采取行動(dòng),制定和執(zhí)行各種AI政策和法規(guī)。在4月份,我國(guó)網(wǎng)信辦出臺(tái)《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》,明確了生成式人工智能的定義,為行業(yè)劃定底線從明確條件要求、劃定責(zé)任主體、形成問(wèn)題處理機(jī)制、明晰法律責(zé)任等方面進(jìn)行規(guī)范。
感謝您的關(guān)注,您有任何問(wèn)題都可以在此留下信息,中芯匯金會(huì)及時(shí)為您提供幫助。
提交