成功的數據和AI-driven公司的四大特征
2022年1月20日 在數據策略
在磚,我們有機會幫助成千上萬的組織現代化他們的數據架構雲從大規模數據和提取的價值分析和人工智能。在過去的幾年中,我們已經幸運地與顧客直接接觸各個行業和地區對由數據驅動的願望和路障,減緩他們的能力。beplay体育app下载地址雖然挑戰行業之間的差異很大,甚至個人組織,我們已經開發出一種富有的理解數據的四大習慣和AI-driven組織。
之前的習慣,讓我們看看如何組織接近使數據的策略。首先,數據團隊已在時間的技術決策,推動思維方式是基於技術棧:數據倉庫、數據工程,流媒體實時數據科學和機器學習。問題是,不是業務部門如何思考。他們想用例,決策過程和業務問題(例如,客戶360,個性化、欺詐檢測,等等)。結果,支持用例跨技術堆棧縫合練習變得複雜起來。這些痛點並不隻是傳聞。在最近的一次調查磚和麻省理工學院技術評論,87%的受訪機構難以與他們的數據成功策略;它經常回到關注的技術堆棧的方法。“其次,仍然是充足的支持團隊定製構建的解決方案而不是購買現成的產品。這並不是說沒有有效的場景定製的解決方案是正確的選擇,但在許多情況下技術供應商可以解決大多數常見的和低改變用例使團隊專注於更多的增值項目索引創造價值的商業變得更快。最後,從人的角度來看,組織在他們的善意的策略將技術與業務成果但失敗了,因為數據沒有被周圍的企業文化——事實上在解決2022年的數據和AI領導行政調查,91.9%的受訪者認為文化是最大的挑戰成為數據驅動的組織。
幸運的是,這些挑戰都是可以解決的,但需要采取一種不同的方式。我們目前在“數據複興”,企業認識到,執行新的數據和人工智能的用例,孤立的技術堆棧的遺留模型需要給一個統一的方法。換句話說,它不是關於數據分析或隻是ML -它是關於建立一個完整的企業範圍內的數據,分析和人工智能平台。Beplay体育安卓版本他們也認識到,他們需要讓他們的數據團隊提供更多的交鑰匙解決方案以專注於創建業務價值,而不是建築技術棧。組織也意識到戰略不能自上而下的集權計劃但需要支持與培訓提高素質和能力,使數據無處不在和日常生活的一部分。最終,每個組織試圖找出如何實現這一切而使事情簡單。所以你如何到達那裏?這是我們已經確定了在頂部習慣成功的數據和AI-driven組織。
1。擁抱一個人工智能的未來
當我們第一次開始在磚的旅程,我們經常討論如何高質量的數據分析是至關重要的,但更對於AI,後者,特別是對於數據驅動的決策,將未來的力量。隨著時間的推移,就像用例個性化、預測、疫苗的發現,和生產分析與人工智能加速和先進,人們更舒適與人工智能的未來。習慣正從問問發生了什麼事?現在關注為什麼,生成高信心的預測,並最終影響未來的結果和業務決策。我們看到世界各地的組織勞斯萊斯,荷蘭銀行(ABN AMRO),殼牌,Regeneron,康卡斯特公司,彙豐銀行使用先進的數據分析和人工智能交付新功能或大幅提高現有。我們看到在每一個垂直的。事實上,段彭數據和人工智能的高級WarnerMedia認為,“人工智能的影響才開始。在未來幾年,我們將看到大量增加人工智能是如何重新定義客戶體驗。”
2。明白未來是開放的
有一個有趣的統計麻省理工學院州50%的數據和技術領袖說,如果考慮到重做按鈕,他們會接受更多的開放標準和開放格式的數據架構——換句話說,可選性。這種方法所麵臨的挑戰是,許多數據從業者和領導人將“開放”嚴格與開放源碼,主要的上下文中on-prem(即世界。Apache Hadoop)。但通常情況下,你有一個開源引擎,它隻是關於如何讓服務和支持。
在我們與首席信息官和cdo開放對他們意味著什麼,這可以歸結為三個核心信條不符。首先,對現有的解決方案,可移植性的成本是什麼?很高興你把一些代碼在GitHub回購。這不是他們所關心的。他們真正關心的是,如果它歸結到它,移動的可行性從平台從功能和成本的角度來看。Beplay体育安卓版本接下來,這些功能如何允許插入到一個豐富的生態係統,不管是國產還是利用其他供應商產品嗎?第三,內部從業人員在新員工培訓的學習曲線是什麼?他們能達到多快的速度?
每個組織所承受的壓力也日益增大飛飛機的升級,但是當我們去的地方有多個選項如何飛和升級,開放特性允許未來的可選性。啟用了可選性的擁抱開放標準和格式正在成為一個關鍵組件組織越來越多的優先策略。
3所示。是多重雲準備好了
有三種類型的數據和AI-driven組織:那些已經多重雲,人變得多重雲,那些關於多重雲保持中立。事實上,埃森哲谘詢公司預測了多重雲作為他們4號雲2021年及以後的趨勢。司機多重雲的方法有很多,如交付新功能的能力與特定於雲的最佳工具,合並和收購,做生意的和要求等規定,客戶的特定於雲的要求,等等。但最大的動力是經濟杠杆。隨著雲計算應用和數據的增長,對許多人來說,雲基礎設施支出將是最大的項目之一。隨著組織考慮多重雲架構,兩件事卷起的需求。首先,終端用戶體驗需要是相同的。數據領導人不希望最終用戶去思考如何管理數據,在雲供應商單獨運行分析或建立模型。第二,在這個追求一致性,他們不希望一些打折扣的能力。有很多的雲提供商正在在他們的基礎設施的投資。和成功的組織認識到需要確保他們操作每個雲,他們深深地融入在性能、功能、安全、和計費。這是非常困難的。
4所示。簡化數據架構
生產力和效率是至關重要的。最終任何現代化的努力旨在簡化架構來提高生產率,對組織有多米諾效應的新見解的能力,構建數據產品和提供創新更快。組織希望他們的數據團隊專注於解決業務問題和創造新的機會,不僅僅是管理基礎設施或報道的新聞。給你舉個例子,穀歌發表“技術債務隱藏在機器學習係統”,概述了與建築相關的稅收ML產品。最終研究結果得出的結論是,數據從數據管理團隊花更多的時間在其他事情上,管理,比實際的ML代碼和管道,這是最終將推動業務發展。
這就引發了一個問題:如何數據團隊盡可能自動化和花更多的時間將針的事情嗎?許多組織工程師愛構建一切。但你想問的問題是:正在建設一切自己正確的方法?你怎麼關注的核心力量和競爭優勢?任何組織的基本需求沒有那麼獨特;事實上,許多人在同一旅程,和第三方解決方案正變得非常有效地自動化交鑰匙任務。問自己有多少值得基本上降低整體TCO和能移動得更快嗎?或者是,Habsah Nordin馬來西亞國家石油公司的企業數據,主管所說,“這不是關於你的技術堆棧是複雜的。重點應該是:它將幫助創造最大價值的數據呢?”
為什麼有那麼多掙紮,如果這是簡單的嗎?
答案是:30年以上的支離破碎,偏振遺留技術棧繼續變得更大、更複雜。下圖是一個簡化的照片是什麼現實了許多。事實上,隻有13%的組織實際上是成功的數據策略和欠他們專注於正確聲音數據管理和體係結構的基礎。
首先大多數組織土地所有的數據在數據湖,但讓它可用,他們必須建立四個單獨的孤立的堆棧。紅點代表客戶和產品數據,必須複製和移動這些不同的係統。這種複雜性的根源來自這樣一個事實:有兩個獨立的方法是相互矛盾的。
一方麵,你有數據湖泊,它是開放的,和在另一端專有的數據倉庫。他們不是真正的兼容。一個主要基於Python和Java。另一個是主要基於SQL,這兩個世界不混合和匹配很好。你也有不兼容的安全性和治理模型。所以你要做安全治理和控製文件的數據表和列的湖和數據倉庫。他們就像兩個磁鐵,聚在一起,而不是相互排斥的更廣泛的人口幾乎是不可能的組織建立在上述四個習慣。即使原始數據倉庫的架構師,Bill Inmon是認識到上圖中概述事務的當前狀態不是會解鎖下一個十多年的創新。
“大趨同的湖泊和倉庫
隨著組織思考他們的方法,隻有兩條路徑,lake-first或warehouse-first。讓我們首先探索數據倉庫,已經出現了幾十年。他們的業務分析和後視鏡數據分析,重點關注報道新聞。但是他們對先進的分析功能,並與他們合作會相當複雜當數據團隊被迫所有數據進入數據湖開新用例。此外,數據倉庫往往是昂貴的,你試著規模。數據的湖泊,世界上絕大多數的數據駐留在今天,幫助解決這些挑戰。多年來,一群大湖泊水類比出現數據數據流、數據河流、水庫本身支持毫升和人工智能。但是他們不做好支持其中一些核心商業智能(BI)的用例,它們缺少數據倉庫的數據質量和數據治理部分包含。數據常常成為湖泊沼澤。結果,我們現在看到湖泊和倉庫之間的融合數據lakehouse架構的崛起。
Lakehouse結合最好的數據倉庫和數據湖泊lake-first方法(看到常見問題)。如果您的數據已經在湖裏,為什麼出來限製遷移到數據倉庫……然後是痛苦當試圖執行人工智能和分析用例?相反,與lakehouse架構,組織可以開始構建四個習慣中看到成功的數據和AI-driven組織。通過lake-first方法解鎖所有組織數據,支持和易用、自動化、和可審計的工具,一個人工智能的未來變得越來越成為可能。組織也獲得可選性,曾被認為是一個童話故事。真正的lakehouse架構是建立在開放標準和格式(和磚平台是建立在三角洲湖,MLflowBeplay体育安卓版本,和Apache火花™),它使組織能夠利用廣泛的現有和未來的技術,以及訪問大量的人才。選擇權也延伸到被多重雲準備不僅獲得杠杆,也確保一致的經驗為用戶提供一個數據平台不管雲提供商的數據駐留。Beplay体育安卓版本最後,簡單起見,這個不用說,如果你能降低兩個獨特的截然不同的技術棧的複雜性,從根本上建立獨立的結果,一個簡化的技術絕對景觀成為可能。
你應該希望外賣是你不是一個人在這個旅程,還有偉大的例子,在每一個行業組織,地理上取得進展簡化他們的數據,分析,和AI平台為了成為數據驅動的創新中心。Beplay体育安卓版本檢查使數據和人工智能在規模策略指導學習更多的關於構建數據驅動組織的最佳實踐以及最新的2021年Gartner魔力象限(mq)磚是唯一的原生雲供應商被命名為一個領導者在雲數據庫管理係統和數據科學和機器學習平台mq。Beplay体育安卓版本