在智能時代,數據的價值變得前所未有的重要。以ChatGPT為代表的生成式AI讓人們看到了AI技術的顛覆性,一時間,大模型、加速計算、數據要素、數據隱私等概念風起云涌,此時,對數據進行有效的采集、處理、分析、治理,成為企業實現商業成功的關鍵。每一年,Gartner都會對市場熱門的技術趨勢進行深入研究,從中找到值得關注和投資的方向,為企業主提供發展參考。5月18日,Gartner發布了2023年十大數據和分析(D&A)趨勢,包括數據即業務、數據價值規?;⒁匀藶橹行慕祿治銎脚_三個主題。
2023年十大數據和分析趨勢
Gartner研究總監孫鑫表示:“我們發現,如果只是把數據分析能力作為一種IT能力做運維,往往難以發揮讓業務比較大的價值。但是,如果把數據能力變成一種業務能力進行拓展,就會衍生出一些獨立的、更有意思的商業模式,因此,‘數據即業務’已經發展為一種全球的趨勢,吸引了很多中國企業關注?!崩?,有時數據分析會作為一種產品進行銷售,更多的業務人員也會承擔一些數據分析或數據管理的職責。
(資料圖片)
孫鑫認為,企業要讓數據分析與業務價值產生更清晰的聯系,以此來進行更有針對性的投入,避免重復勞動。對此,Gartner推薦企業使用“業務價值流工具”進行數據的分析和管理,可以自上而下的幫助企業了解重要的業務節點和流程,輔助管理者做出決策,實現應有的價值。隨著更多的創新發生在云端,圍繞AI和數據分析的擴展性、兼容性、持續性和成本被頻繁提及,由此也引發了有關數據編織和數據網格的熱議,企業希望可以提升數據的業務場景化能力。
Gartner對數據網格(Data Mesh)的定義是以業務主導的方式管理數據,用于定義、交付、維護、管理數據產品,讓數據發揮更大的價值。如果想實施好數據網格,需要在業務端配備數據產品經理的崗位,輔助做一些自服務分析,根據不同層級設置相互關聯的治理模式。數據編織(Data Fabric)可以視為較為新型的數據管理設計模式,能夠獲取到靈活可復用、且被AI增強的數據集成管道,其中,會涉及知識圖譜等技術,去更好地分析和理解元數據,提升基于用戶的數據服務體驗。
基于用戶數據消費行為的分析,并在此基礎之上進行推薦,是數據編織要解決的主要問題,讓相關的數據找到相應的人。根據企業所處的數字化階段和能力不同,Gartner提供了兩種數據編織的設計路徑——最小可用數據編制的設計和完整版的數據編制設計,企業可以據此進行數據優化和調整。招商銀行建立了新一代數據目錄,希望進一步優化數據分類體系,在該目錄中進行的搜索、檢查、請求等操作會被記錄,這些操作型的元數據會被反饋到數據分類體系中,結合機器學習等技術進行自主演進,從多維度了解不同用戶的實際需求。數據編織可以幫助企業用戶實現快速的自服務,幫助數據管理團隊實現更高效的數據生產力,大幅縮短數據需求響應時間,幫助企業主體加速投資回報。
借助高度可組合的數據分析生態,數據分析能力可以和微服務等技術整合,以模塊化的方式快速落地到業務場景中。企業對于分析平臺的可組合性較為關注,不同崗位的人員會在不用階段根據不同需求選擇匹配的技術路徑,包括數據可視化、自動數據洞察、數據故事、數據敘事、自然語言驅動的分析、數據準備和報表會滿足不同的業務需求,由企業按需來進行定制化的組合,而底層則是通過合作能力、指標平臺/中臺、治理能力、數據科學整合能力、數據目錄能力,以及對數據源的連接來提供基礎支撐。
在孫鑫看來,使用商業智能和數據科學平臺的用戶愈發多元化,既有業務分析師,也有數據分析的開發者、數據科學家,還有被增強過的數據消費者,“面對更廣闊的用戶,也要有更靈活的使用數據分析產品的架構,去建立更靈活的分析體驗,這也是今年我們在‘魔力四象限’評估時比較重要的點。”除此之外,還會有一些新的產品形態來輔助建設業務指標。例如,指標平臺/指標中臺可以利用虛擬層管理不同的數據源,分析目錄可以管理不同廠商的報表,帶來統一的使用體驗,這些目錄可以被進行評級和打分,便于各方選擇使用,同時,很多企業也在對外輸出數據分析能力,使得數據的生產者和消費者相互轉換,形成了對數據分析能力的發布-組合-再創新的生態循環。
分析目錄
如今,AI已經是擺在企業面前的一道必答題。Gartner將Emergent AI視為今年的科技趨勢之一,AI技術已經能夠以更少量的數量達到更高的復雜度,預計到2026年,通過生成式AI驅動的數據分析能力,將吸引20%的大型企業數據和分析的支出,以支持這些企業對于自動化閉環數據分析結果的需求。此時,企業要學會主動迎接AI的浪潮,可以借助NLP等技術實現“決策智能”,完成從數據分析到業務行為的閉環。
孫鑫認為,生成式AI實現了嵌入式的增強體驗,可以幫助用戶完成更高級的數據分析,大幅降低了使用門檻。Gartner建議企業可以學習掌握提示工程(Prompt Engineering),通過全新的交互界面進行驗證,從輸入的角度核實、輸出的角度理解并拓展大語言模型,輔以專門的工程師開發和優化由AI生成的文本。在招商銀行內部,已經在使用聊天軟件進行數據分析的相關討論,提升數據使用效率。未來,數據科學家會更加關注大語言模型的調參,使其能夠運用到千差萬別的業務場景中。
AI戰略的實施往往“事與愿違”
盡管AI可以為企業帶來更低的成本和更好的決策,但是像生成式AI這樣的新技術也會帶來不少風險,例如所學習的數據存在偏見和錯誤,企業既要保證數據來源的多樣性,也要避免遭遇一些瑕疵,同時,如果錯誤的信息沒有經過適當的監管和審查,也會造成額外的損失。企業不能過度依賴AI提供的結果,要建立一套責任機制進行數據治理,確保生成式AI的使用是可靠的,遵守當地的隱私和安全法規。錯誤的信息、認知偏見,以及數據版權等問題,使得人工審查有著充分的必要性。
談及生成式AI的未來走向,孫鑫給出了進一步解讀,涉及架構、模型和運營。首先,英偉達在加速計算領域為AI算力奠定了重要基礎,不過考慮到產品供應等問題,AWS、GCP等云廠商同樣具有很大的發展空間,一些基礎設施供應商也會集成預訓練模型來提升硬件的價值。此外,大模型和“Fine-Tuning”模型會越來越多,Fine-Tuning模型的匹配度更高,使用相對較小、貼近業務場景的數據集即可滿足要求,成本會隨之降低,開源技術也會發揮更多的作用。同時,基于大模型構建的具有行業屬性的特定模型將愈發普及。對于技術供應商來說,AI的安全治理、性價比等能力將是差異化或是護城河的體現。運營方面,“提示工程”的市集可以從多方面完善大模型的體驗,“矢量數據庫”則能夠讓生成式AI更了解企業所需,再加上Fine-Tuning模型和API管理工具,就能讓企業在使用AI技術時更加得心應手。
“最后,我還是要強調一下,對于‘負責任人工智能工具’的投入是非常重要的。在中國,可能這一塊相對來講還比較空白一些,我們看到這種負責任的人工智能工具將在運營側發揮關鍵的作用,甚至可以提供一些‘紅隊測試’、可解釋性或者內容的管控,以減少我們基于人工智能用例的有害影響?!皩O鑫說。
關鍵詞:
推薦閱讀
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 www.ymshequn.com 愛好者日報網 版權所有 聯系網站:435 226 40@qq.com