人工智能行業現狀
人工智能已經歷十幾年的快速發展,尤其是近些年,人工智能在大數據、大模型的深度學習之路上一路高歌猛進,目前已經形成了用大數據代替經驗、用算法挖掘知識、用并行計算確保模型訓練的可行性的基本范式。
現在有大量的基于感知能力的AI模型已經廣泛應用于各行各業,但是目前人工智能還只是“弱人工智能”,很多核心問題依然沒有解決,比如如何讓模型具備真正的理解能力。
從技術上看,人工智能的應用呈現出工程化的趨勢。由于多元的人工智能應用場景日益增多,用戶體驗要求越來越高,對于迭代速度的要求也有所提升,傳統的開發方式已經無法滿足企業客戶的需求,同時由于遷移能力的限制,不同場景的問題仍需要大量的定制模型的開發。
為適應人工智能工程化的需求,人工智能勢必將和數據有更加緊密的聯系。現在70%-90%的AI工程師把時間和精力都用在數據而不是模型代碼上,模型已經不再是工程應用方面的最大瓶頸,而訓練數據已成為機器學習工程師全新的挑戰。
與此同時,新算法不斷涌現,預訓練模型正在蓬勃發展,推動了技術效果不斷提升,雖然降低了標注數據的門檻,但計算成本有所上升。另外,大規模模型近年也成為研究熱點之一,模型參數規模指數從億級發展到萬億級的增長,算法模型大量開源,使得云計算的成本下降,而人力成本逐漸飆升。
Data-Centric MLOps
在這樣一個大背景下,倍賽科技CTO劉世林博士應邀在第四屆智能制造創新高峰論壇活動中,進行了以“打造Data-Centric MLOps基礎設施,助力AI提效”為主題的演講分享,總結了企業在人工智能工程應用方面的兩大實踐方向。
一個是基于中小型的模型,配合較多的“好數據”和較低的計算資源;另一個方向則是使用大模型,用較少的“好數據”和較多的計算資源。可以看出,兩個實踐方向的核心都離不開“好數據”,所以,劉世林博士推薦企業AI的工程實踐圍繞Data-Centric MLOps的應用策略展開,更加便捷、高效地實現人工智能落地應用和產品交付。
Gartner預測:“到2025年,人工智能和數據科學平臺市場將以21.6%的復合年增長率增長到超過100億美元,基于Data-Centric MLOps的巨大市場潛力,倍賽科技重新定義了企業戰略方向,將面向全球提供AI賦能的Data-Centric MLOps軟件基礎設施,從數據采集、數據標注、數據治理、模型驗證和模型開發的各個環節,提供了一體化、全方位的技術軟件與服務體系,使用AI的能力加強軟件實力的同時,加強高質量數據的處理和生產,幫助客戶快速完成數據與模型迭代,高質量、高效率實現AI場景落地。
作為公司實施Data-Centric MLOps戰略的第一步,倍賽科技重新設計并研發了新一代多模態數據標注平臺X1。X1平臺集成了大量的AI能力,提供了完整且功能強大的“數據標注工具集”, 可同時滿足自動駕駛、遙感、醫療等精細化、高量級的數據需求,工具集及AI質檢及預標注模塊可提升至少30%的效率。同時,平臺內置了數十套模型庫,一鍵訓練及部署模型,打破從數據到模型的技術鴻溝,底層海量存儲及傳輸積累了大量原創技術,成為建模業務堅實產品基礎,助力企業AI快速落地,落地周期縮短75%,成本節省65%。
目前倍賽科技已經完成了從“標注平臺”到“一體化AI基礎設施方向”的晉階,后續會在練好“產品功”的基礎上,探索更上層的“垂直解決方案”,構建最易于訪問的Data-Centric MLOps,用于連接人、模型和數據。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
關鍵詞: