來源:互聯網
自1950年英國數學家圖靈在其一篇標志性的論文中首次提出“人工智能(AI)”這一概念以來,人類對AI領域的探索便從未停歇。直至2022年末,Chat-GPT的問世標志著AI技術的一個重要里程碑,它在語音圖像識別、自然語言理解等復雜任務中展現出了卓越的能力。這一突破進而催生了2023年基于龐大數據量和知識庫構建的大模型的爆發式增長。
在中國,眾多大型企業如百度、阿里巴巴、華為、科大訊飛、騰訊等,積極地在大模型領域進行布局,“百模大戰”初見端倪。大模型作為科技界的頂流,其發展速度從誕生至實際應用均異常迅猛,并且迅速步入了互聯網行業擅長的價格戰階段:
2024年5月6日,幻方公司旗下的DeepSeek推出了DeepSeek-V2,其定價僅為GPT-4-Turbo的近百分之一,這一舉動標志著大模型降價趨勢的開始,如同多米諾骨牌效應的第一張牌被推倒。隨后,阿里巴巴的通義千問與百度的文心一言也加入了這場價格戰—阿里云通義千問一次性對9款模型進行了降價,其中GPT-4級別的主力模型Qwen-Long價格更是暴跌97%。
2024年12月26日,一則重磅消息在全球 AI 技術領域,特別是正處于價格戰高峰期的中國炸開了鍋——幻方公司旗下深度求索(DeepSeek)正式上線全新系列模型 DeepSeek-V3 首個版本并同步開源,該版本在保證模型能力的前提下,實現了訓練效率和推理速度的大幅提升,其通過架構創新,實現了大模型成本尤其是推理成本巨幅下降,節約了42.5%的訓練成本。這不僅意味著 AI 大模型的應用將逐步走向普惠,為各類AI應用的廣泛落地提供了有力支撐,還預示著隨著訓練效率的提升,推理算力需求將大幅增長,為AI產業鏈帶來了加速商業化落地的黃金機遇。
AI大模型正在從技術變革走向產業變革,算法革新與模型優化下的推理成本極速下降,無數的 AI 原生應用,正在重新定義我們與數字世界乃至物理世界的交互方式。中國工程院院士鄔賀銓指出,盡管基礎大模型在通識能力上表現出色,但在聊天應用方面難以成為用戶的剛性需求,為了充分展現大模型的價值,關鍵在于將其應用于具體行業并實現落地。百度創始人兼董事長李彥宏則認為,人類真正邁入AI時代的標志不在于誕生眾多大模型,而在于涌現出大量的AI原生應用,他強調,未來我們更需要的是數以百萬計的AI原生應用,而非僅僅局限于幾十個所謂的大模型。英偉達CEO黃仁勛也預測,AI領域的競爭將推動一系列現成的人工智能工具的誕生,從芯片設計、軟件開發到藥物研發和放射學等多個行業,各家公司將會根據自身需求,將獨特的技術、數據與AI能力相融合,從而發揮出更大的效能。
如何利用AI大模型實現商業化價值,尤其是如何將AI技術與市場需求緊密結合,成為了企業脫穎而出的關鍵。與DeepSeek同處于杭州這一數字化新城的浙江水科文化集團有限公司,在AI大模型技術尚未廣泛進入公眾視野時,便已敏銳地洞察到了這一領域的巨大潛力。經多年的技術積累與低調發展,浙江水科文化集團創新性地開發出了“Shoot-AI”這一模型,將AI與人臉識別、智能拍攝、語音模型等技術緊密結合,并且整合了云端計算、大數據等多項前沿技術,經過不懈的技術研發與迭代,逐步完善了“AI大模型+場景應用”的布局,構建起了一套完整的商業化應用體系。
定制化“AI模型+場景應用”的解決方案,將是AI模型“百模大戰”后的主戰場。浙江水科文化集團為文旅市場量身打造了一套數智化解決方案,為文旅產業的發展注入了新的活力,創造了AI大模型技術與市場需求緊密結合的先鋒典范。與此同時,浙江水科在算法革新與模型優化下,1位工程師僅需1個H-100芯片就能在一個月內練好一個場景模型,推算成本巨幅降低,這也為AI模型的商業化應用節省了成本。