Copyright ? 2021-2021 武漢洪山科創產業發展有限公司 All Rights Reserved. 備案號:鄂ICP備2022000812號-1
摘要
近期OpenAI、微軟和百度競相發布大模型產品,帶給人們實實在在的震撼體驗。MaaS(Model as a Service)模型即服務以其通用性、自監督學習能力和強大的智能能力助力AI產業化進程,降低AI落地應用的門檻。國內外AI領域企業競相研發有競爭力的大模型產品,大模型領域已初步形成生態規模。未來,大模型在應用端、中間服務端以及底層服務端發展潛力巨大。
從OpenAI發布GPT-4,到百度發布文心一言,再到微軟發布Office的AI生產力工具Microsoft 365 Copilot,各大廠紛紛重金布局既是前瞻性的戰略舉措,也是資本和技術的完美展示。據報道,GPT-3訓練一次的成本約為140萬美元,2022年,OpenAI公司凈虧損5.45億美元,成立七年累計凈投入近40億美元。人們不禁要問,是不是只有大廠才有資格參與人工智能這場盛宴?AI是否只掌握在少數大廠的算法人員手中,難以走向大眾化?模型即服務(MaaS)作為一種新的商業模式,有望打破局限,即便是非互聯網行業小公司,也可能通過MaaS模式,打造出一款專業領域的爆款應用軟件。
一、何為MaaS
在云計算時代,我們已經熟悉的是IaaS(基礎設施即服務)、PaaS(平臺即服務)和SaaS(軟件即服務),而MaaS 作為AI領域一種全新的商業模式,正如李彥宏所說,過去云服務看算力、存儲等基礎,未來則更多會看框架與模型,MaaS將會改變云計算的游戲規則。
大模型是“大算力+強算法”結合的產物,通常是在海量公開的無標注數據上進行訓練,學習出一種特征和規則,應用開發時通過目標任務場景中的小數據集進行微調,使模型達到需要的性能,就可以完成多個應用場景的任務。在這一過程中,這種在公開數據集訓練過的深層網絡模型,即為“預訓練模型”,預訓練能夠大大降低下游任務模型對標注數據規模的要求,從而可以很好的處理一些難以獲得大量標注數據的新場景。
簡單來說,MaaS模式下,通常是科技巨頭開發出一套AI模型作為一個通用的底板,正如一個“通識型人才”,通過對外開放這些AI模型的調用接口吸引規模較小、但是深耕行業的玩家,由細分領域的公司將模型打磨成真正滿足行業需求的應用,也就是培養出“專業人才”。
AI大模型的開發方式
參考資料:百度文心大模型官微
二、MaaS能給AI產業帶來什么
自人工智能誕生以來的七八十年間,帶給人們的驚嘆比比皆是,MaaS的概念之前也被提出過,但為何在今時今日火爆出圈?
從上世紀六十年代最早的智能機器人Shakey,到八十年代深藍戰勝國際象棋冠軍卡斯帕羅夫,再到2016年的AlphaGo戰勝世界圍棋冠軍等等,AI技術從來不缺讓人震撼的新聞,但真正能夠產業化落地的卻少之又少,過去的AI熱帶火的更多是概念和信心,但還沒有產生顛覆某個行業的影響。但是這一輪AI技術帶來的完全是不同的新體驗,2022年ChatGPT的出現,讓我們所有普通人都感受到切切實實的“好用”,上線僅僅2個月后注冊用戶數就突破了1億,完全超出人們的預期,這是有可能顛覆“搜索引擎”行業的新技術。
目前,人工智能正處于產業化落地應用的早期階段,努力發展 “好用”的產品,但面臨著人力研發成本高、特定場景數據較少導致模型訓練精度不夠、模型算法產品化實際效果不滿足需求、場景需求碎片化等行業痛點。而大模型通過提高模型的通用性、降低研發成本等方式能夠加速AI產業化進程,降低AI落地應用的門檻。
(1)大模型的通用性提升AI 開發的效率
過去近10年間,AI開發主要是通過“深度學習+大算力”從而獲得訓練模型,但是在傳統模式中,AI模型基本上是針對特定應用場景需求進行訓練的,整個模型開發需要完成從確定場景需求、數據收集、模型設計到落地應用等階段的整套流程,不僅耗費時間長,一個項目往往需要數月甚至數年才能完成,而且對人力素質要求很高,需要優秀的產品經理、專業的AI 研發人員等協同合作,人力成本高昂。但是,這樣定制化的模型開發方式得到的模型在許多垂直行業場景任務下并不通用,模型無法復用和積累,導致了AI落地的高成本、高門檻與低效率。
而大模型通過從海量的、多類型的場景數據中學習,總結學習不同場景業務下的通用特征和規則,成為具有泛化能力的模型底座,利用大模型進行新的業務場景下的應用開發時,對大模型進行微調或者不調整,就可以完成多個應用場景的任務。過去,云計算服務商通常會將硬件資源、通用的軟件能力、底層框架等來提供服務,如今,基于大模型的通用能力可以有效應對多樣化、碎片化的AI應用需求,模型也上升到底層框架服務的維度,開始成為第一生產力。MaaS體現了All For everyone的概念,數據集倉庫、模型倉庫、算力平臺通過提供零門檻模型體驗、快捷的模型使用、完整鏈路的模型定制和云端模型部署向每個人開放,包括AI愛好者、使用者、開發者和研究者。
MaaS基本產業架構
參考資料:阿里云棲大會
(2)大模型的自監督學習能力降低AI開發及訓練成本
傳統的模型訓練過程中,需要不少AI專業研發人員手工來完成大量的調參、調優工作,同時,模型訓練需要海量的數據,但是許多行業數據收集困難、標注成本高,研發人員需要花費大量的時間精力收集整理原始數據。
相對于傳統AI模型開發模式,大模型的研發流程更加標準化,通用性更強,可以泛化應用到多種行業場景中,而且,大模型的自監督學習能力可以取代傳統的人工標注數據完成模型訓練的模式,能夠顯著降低研發成本,為解決AI落地難、促進AI產業化進程這一問題提供助力。
(3)大模型帶來更強大的智能能力 除了通用性和自監督學習能力以外,大模型最突出的優勢在于效果,其通過給模型“填喂”大數據提高其自我學習能力,進而具有更強的智能程度,所訓練的數據規模越大,生成的模型也就越智能。OpenAI的研究表明,2012至2018年,在最大規模的人工智能模型訓練中所使用的計算量呈現指數級增長,其中有3.5個月的時間計算量翻倍增長,遠快于摩爾定律每18個月翻一倍的速度。據有關研究者預測,下一代AI大模型,參數的數量級將于人類大腦突觸水平比肩,并且不僅能處理語言模型這樣的單一任務,更能夠處理語言、聲音、圖像等多任務的多模態AI模型。
三、MaaS 的應用場景
在AI產業鏈中,大模型作為一種基礎設施,可以搭載各式平臺,將AI技術賦能千行百業。正如過去電力時代一樣,電力經過生產和運輸運用到各類電器,如今智能通過數據訓練和計算應用到各類場景。相應地,大模型公司也將成為AI領域中的基礎類公司,發揮大模型作為基礎設施與底座的能力,基于“大算力+強算法+大規模預訓練+微調”的方式滿足AI產業鏈下游客戶的應用需求。
大模型基礎設施賦能千行百業
資料來源:智源研究院
AI大模型行業適用范圍非常廣泛,在醫療、金融、交通、零售、氣象、新聞傳播、文學藝術等領域都有廣泛應用場景。大模型可以抓取所需數據,自主完成篩選和分析,在大模型中輸入關鍵詞、主題等設定屬性后,即可生成滿足需求條件的文本內容,并自主撰寫生成報告,可以用于產品營銷文案寫作、電商智能客服等,也能輔助從業人員做決策。還有自動問診、小說續寫、電力檢測……因為懂得人類語言,且具備各種細分行業的專業知識,AI大模型具有分飾多角的能力。 2022年11月,阿里達摩院推出AI模型社區“魔搭”ModelScope,率先向魔搭社區貢獻300多個經過驗證的優質AI模型,包括視覺、語音、自然語言處理、多模態等AI主要方向,踐行模型即服務的新理念,提供眾多預訓練基礎模型,只需針對具體場景再稍作調優,就能快速投入使用。 2022年12月,美國谷歌利用一個已成形的基礎AI算法,疊加上專門基于醫療數據的訓練流程進行微調,經過兩輪打磨之后建立了Med-PaLM的模型,未來有望助力AI問診,降低醫療服務的成本。在音樂領域,兩位畢業于美國普林斯頓大學的工程師利用業余時間,在一款已經開源的AI畫圖算法的基礎上,微調模型,將其改造成一款叫做Riffusion的AI音樂創作工具。
四、國內外大模型布局
當前,大模型領域已初步形成生態規模,國內外眾多公司和研究機構在大模型領域積極布局,大模型參數規模最高已達百萬億級別,且面向多模態場景的大模型已成為未來的趨勢。
國外的超大規模預訓練模型起步于2018 年,并在 2021 年進入白熱化階段。2017年,Vaswani等提出Transformer架構,使深度學習模型參數達到了上億的規模。2018年,谷歌提出了大規模預訓練語言模型BERT,同年OpenAI提出了生成式預訓練Transformer模型——GPT,使自然語言處理領域飛速發展。之后,OpenAI 繼續推出15億參數的GPT-2、1750 億參數的超大規模語言訓練模型 GPT-3,通過兩年時間實現了模型規模從億級到上千億級的突破,實現作詩、聊天、生成代碼等功能。2021 年,谷歌推出首個萬億級語言模型Switch Transformer。高速發展一直持續到2022年,OpenAI 推出ChatGPT、GPT-4,震撼了幾乎整個世界。大型語言模型的參數數量保持著指數即的增長。
在國內,超大模型的發展也非常迅速,2021年是中國 AI大模型的爆發年。2021 年,商湯發布擁有 100 億的參數量的書生(INTERN)大模型,截至2021年中,商湯已建成擁有超過 300 億個參數的世界最大計算器視覺模型。同年4月,華為云聯合循環智能發布參數規模達1000 億的盤古NLP超大規模預訓練語言模型。隨后,浪潮信息發布約2500億的超大規模預訓練模型“源 1.0”,百度推出參數規模達2600 億的ERNIE 3.0 Titan 模型,而阿里達摩院的M6模型參數達到10萬億,將大模型參數直接提升了一個量級。2022年,清華大學、阿里達摩院等聯合研究的“腦級人工智能模型”八卦爐(BAGUALU)發布,模型參數突破了174 萬億個,完全可以與人腦中的突觸數量相媲美。
信息來源:商湯科技官微,天翼智庫、公開信息
五、發展機遇
李彥宏在文心一言發布會上預言大模型時代將產生三大產業機會,排在首位的是新型云計算公司,其主流商業模式從IaaS變為MaaS。大模型時代的來臨催生新模式新業態,AI大模型正逐步融入到生產生活領域的每一個核心場景,最大的發展機遇就是在應用端。圍繞大模型底座進行應用開發的公司,即應用服務提供商,基于文本生成、圖像生成、音視頻生成等場景,開發金融大模型、醫療大模型、交通大模型、能源大模型等一系列應用大模型,將技術平臺與產業深度融合,完全有可能成為未來的獨角獸企業,挖掘出巨大的市場潛力。
MaaS模式下的人工智能行業,也不再只是科技巨頭的市場,那些多年深耕細分行業,具備行業模型精調能力的公司,可充分利用自身懂市場、懂業務、懂客戶的優勢作為通用大模型和企業之間的中間層,創造出更好的細分產品。而底層服務方面,新型云計算公司將迎來發展機遇,主流商業模式將從IaaS變為MaaS,以模型服務為新的業務增長點。
大模型已開啟AI新時代,未來市場潛力和想象空間巨大,讓我們拭目以待。
備注:本文僅作為產業科普,不提供任何投資建議。
參考資料:《人工智能行業專題報告:模型即服務》、《MaaS:Model as a Service 模型即服務》、《深度解析:為什么說MaaS是云計算的未來?》、《人工智能:模型即服務(一)》、《MaaS模型即服務:AI領域獨特商業模式,降低AI使用門檻》、《阿里推出“模型即服務”,開源300+AI模型》