近期,巨杉數據庫舉行線上發布會,發布基于「湖倉一體」架構的v5.2版本,提升多項「實時」能力,詮釋公司「釋放全量數據價值」的價值主張。深度解析在數字化時代下,基于湖倉一體架構的SequoiaDB如何圍繞金融銀行業的實時需求,全面提升結構化查詢分析、非結構化存取、性能監控故障診斷及數據生命周期管理的四大能力,讓全量數據的價值從「內部離線」向「實時對客」進一步釋放。會中,賽迪咨詢深度解讀全國首個《湖倉一體技術研究報告》,詳細介紹湖倉一體架構的興起與未來發展方向。
巨杉基于數據湖的實時能力已經達到全球領先,技術實力得到了金融頭部客戶的認可,產品已在超過100家金融銀行客戶規模化生產上線,其中不乏中國人保、民生銀行、南方電網、中國太平保險等世界500強企業及廣發銀行、廣東省農信等典型客戶。SequoiaDB更服務于多個政府平臺,如支持“粵省事”平臺的醫保、社保數據查詢,這些數據也助力新冠核酸檢測,幫助政府匹配核酸檢測情況。
雙核心:交易核心+數據核心,讓全量數據實時可得
過去的10年,伴隨數字化的深化發展,企業不但需要面向業務交易的信息化傳統「交易核心」,同時更需要面向數據價值的「數據核心」。
信息化時代,「交易核心」解決的是交易系統的問題,面向渠道、產品、客戶、核算及清算等業務流程,確保業務閉環。其交易過程產生的海量流水數據,將成為「數據核心」的生產要素。
數字化時代,「數據核心」解決的是數據的采集、整理、聚合、運用等問題。數字化新核心將為信息化「交易核心」提供實時、跨業務的全量數據,以及基于數據的決策依據,實現數據價值的持續釋放。
「實時」是「釋放全量數據價值」的關鍵。10年前,巨杉數據庫就意識到,數據會成為社會發展關鍵的要素資源,需要提供面向全量數據的實時對客及高并發處理能力。業界遇到的普遍痛點是,面向「交易核心」的數據庫因架構及技術限制僅能服務于指定的業務系統,且無法處理全量數據;以Hadoop為代表的大數據產品雖然可以存放全量數據,但無法提供實時處理能力,兩者皆無法滿足全量數據實時對客服務的發展需求。因此巨杉毅然開始了自研原生分布式數據庫內核的道路,從「多模數據湖」、「實時數據湖」發展到「湖倉一體」,為客戶提供「數據核心」所需的全量數據存儲,實時對客服務,及基于統一數據源的分析能力,充分激活客戶的離線數據。
四大實時能力提升,SequoiaDB v5.2釋放全量數據價值
巨杉數據庫基于湖倉一體架構的SequoiaDB v5.2版本進行了多項更新,此次發布會主要介紹了四大實時特性的能力提升。即將發布的SequoiaDB v5.2版本讓全量數據的價值從「內部離線」向「實時對客」進一步釋放。
查詢更實時,所有數據可毫秒級訪問。面向結構化數據,SequoiaDB v5.2版本提供深度的Join優化及列存微分區技術,在多個查詢場景下,性能達到了毫秒級實時返回;分析場景中,性能更獲得了10倍以上提升,讓數據湖的查詢分析更實時。
存取更實時,吞吐量提升30%以上。面向非結構化數據,巨杉通過「分片并發」及「可變分區大小」的技術,相比原有版本,SequoiaDB v5.2版本吞吐量提升30%以上,讓數據湖的非結構化數據存取更實時。
診斷更實時,業務問題分鐘級定位。發布會上,巨杉數據庫發布SAC運維管理工具的重要特性更新,運行監控方面提供了全GUI的性能及故障分析能力,SAC基于分布式架構的實時診斷,可實現業務問題分鐘級定位。
全量數據生命周期管理,提升人效及能效。部署架構方面,支持多配置硬件的混合部署,針對高并發數據與低并發數據,做到按需調度;面向橫跨結構化、非結構化數據,提供一體化的開發及管理能力,提升人效及能效,在成本可控的前提下,實現全量數據實時可用。
技術迭代互補,而非替代
巨杉數據庫深耕第三代分布式數據庫技術,我們認為分布式數據庫的星辰大海,絕不僅限于對交易核心數據庫的替代。SequoiaDB正通過湖倉一體架構提供面向多模、實時、分析的需求,與各類集中式及分布式交易核心數據庫成為上下游合作伙伴,釋放全量數據價值。
巨杉數據庫SequoiaDB通過基于「湖倉一體」架構,支撐企業的「數據核心」。從企業多個「交易核心」數據庫所產生的業務流水數據,可以以流式入湖的方式,秒級匯聚到SequoiaDB形成全量數據底座。
實時數據湖:為不同業務的跨系統查詢,或多年流水數據獲取,提供高并發的實時查詢能力,所有數據實時可得。相比原來跨多系統進行數據異構訪問的方式,SequoiaDB協助客戶將業務響應時間從分鐘、小時級延遲,到秒級延遲的改變,讓用戶滿意度獲得大幅提升。
多模數據湖:為影像系統、遠程銀行等需要大量管理非結構化數據的系統,提供多模數據湖技術重點優化非結構化對象數據的高并發實時存取能力,實現跨多數據類型的一體化管理,提升研發及運維的“人效”。
實時數倉:在數據湖內提供高性能分析引擎,可以協助企業基于準確而且統一的數據源,進行數據的實時探索及分析、統計、加工,降低數據再次流動的開銷,提升數據處理“能效”,構建綠色低碳的數據基礎設施。
發布會上,賽迪咨詢也對全國首篇《湖倉一體技術研究報告》進行深度解讀,將湖倉一體技術定義為未來發展趨勢。
未來,巨杉數據庫SequoiaDB也將持續聚焦于分布式特性,通過「湖倉一體」架構為客戶打造「數據核心數據庫」,成為數字化時代下堅實的數據基礎設施。在“信創”產業中,堅持踐行信息技術應用創新的理念,服務于企業全量數據實時業務場景,與各類集中式及分布式交易核心數據庫成為上下游合作伙伴,驅動數字化的業務的創新發展,以湖倉一體釋放全量數據價值。
推薦閱讀
近日,賽迪顧問正式發布了國內首份《湖倉一體技術研究報告》。對此,巨杉數據庫特邀賽迪顧問軟件與信息服務業研究專家,對《湖倉一體技術研究報告》進行了深入解讀。伴隨數>>>詳細閱讀
地址:http://www.xglongwei.com/a/05/314158.html