國產開源數據庫走熱,卻難一蹴而就
發布時間:2022-10-26

1. 當下以 Oracle 為主導的關系型數據庫仍然占據許多存量客戶市場,由于風險、成本等因素的考量,仍然沒有采用復雜、大規模的核心系統改造。這對于包括全球化市場在內的任何一家分布式數據庫廠商都是共同挑戰。
2. 開源商業化這條路徑的選擇,需要大量的研發和生態投入,并拉長到十年為單位衡量,如何通過訂閱服務、商業發行版等商業模式,提升企業商業化經營運作的能力?
3. 從共性來講,客戶仍然希望以最快的速度將新業務推向市場,并且能夠在一定程度上應對當下諸多不確定性因素的壓力。但國內數據庫廠商非常之多,這使得客戶的數據庫選型成本非常高,當然這也與客戶在數據庫乃至底層基礎的改造路徑和策略有密切關系。
從 PingCAP 的發展路徑,或許值得參考。
近日,企業級開源分布式數據庫廠商 PingCAP 舉辦了首屆用戶峰會,來自傳音、百勝中國、老虎國際、建信金科、杭州銀行、平安科技等各行業客戶代表分享了與 PingCAP 的合作經歷。鈦媒體 APP 等與 PingCAP 創始人兼 CEO 劉奇 、研發副總裁唐劉、副總裁陳煜琦進行了交流。
梳理過去一年 PingCAP 的兩個最新動作:一是發布 TiDB Cloud,基于亞馬遜云科技、谷歌云、阿里云提供調用接口,強化開源項目 TiDB 的商業化版本能力;二是在國內持續挖掘行業頭部客戶價值,并出海東南亞、日本、美國、歐洲等地區,在全球化市場中構筑用戶壁壘。
基于 TiDB Cloud,PingCAP 發布了 Serverless Tier 和 TiDB Playground,為每一個開發者提供一個免費的云上數據庫,后者可以讓開發者在 5 分鐘內快速體驗 HTAP。此外,PingCAP 構建了 "Ti 星系 " 合作伙伴體系,任何個人、公司、數據平臺、云基礎設施都可以通過 TiDB 開源社區連接在一起,持續挖掘和創造商業價值。
PingCAP 創始人兼 CEO 劉奇在大會上表示,分布式數據庫是一個高度復雜的系統,和云的結合使得復雜性進一步提升。分布式數據庫能否生存下去,取決于能否掌控復雜性。TiDB 分而治之的開放式架構能夠管理復雜性,因此能夠成為更多用戶的選擇。
為此,PingCAP 還啟動了穩態 + 敏態雙軌并行研發機制,一是基于開放式架構,二是基于大量客戶場景,與客戶共創打磨整個產品體系。例如,PingCAP 與平安科技聯合打造了 TiDB 商業發行版 UbiSQL,與百勝中國共同創建分布式數據庫聯合實驗室。
TiDB 是 PingCAP 研發的開源分布式關系型數據庫,定位于在線事務處理 / 在線分析處理(HTAP)的融合型數據庫產品,實現了一鍵水平伸縮、強一致性的多副本數據安全、分布式事務、實時 OLAP 等重要特性,同時兼容 MySQL 協議和生態。
可以看到,開源改變了數據庫軟件的迭代速度,而堅持云計算的服務模式,又將開源主導的企業商業化呈現出了一條可規模的路徑。對于 PingCAP 而言,作為數據庫開源領域成長起來的創新企業,已經逐步構建起核心的生態圈,并且吸引到一定的高質量代碼貢獻者,高度活躍的開源技術社區也在反向推動企業數據庫產品研發能力、工程質量、迭代速度。目前 PingCAP 以外的貢獻者占比超過 75%,其中近 20% 為企業決策者。
當一體化 HTAP 成為一種潮流
如今,數據庫技術融合發展關鍵趨勢明顯,云原生和多云的需求進一步增強,數據庫與大數據的深度融合應用,存算分離也成為發展的主流,一體化實時 HTAP 數據庫成為新的關注方向。
結合 Gartner 對 HTAP 的定義本質來看,HTAP 實際上是通過內存計算來實現,它可以使分析業務與事務業務共享同一份數據,通過消除數據在數據庫和數據倉庫之間的數據遷移,可以對實時事務數據進行實時分析和態勢感知,而不只是對數據進行事后分析。
這意味著構建 HTAP 并不是一步到位的事情。從 TiDB 的演變歷程來看,1.0 版本就實現了在線事務處理的規?;瘮U展,為 HTAP 能力打下堅實的基石;4.0 版本實現初步的 HTAP 能力,OLAP 與 OLTP 分區獨立,物理隔離;5.0 版本在原有 HTAP 引擎的基礎上引入 MPP 架構,進一步提升海量數據下的并行計算與分析能力,支持同一架構下對 Spark、Flink 等技術棧的集成,成為具備完整實時 HTAP 能力的分布式數據庫。
劉奇表示," 從整個 HTAP 的架構來看,這個技術本身的天花板非常高,天花板越高,企業發展的極限就越高。"
過去三年,PingCAP 在實時 HTAP 領域的創新,為企業在數據實施洞察、實時分析、實時變現等場景提供了一站式解決方案。
預計在接下來,PingCAP 將在 DB 微服務化、云原生、智能化等技術方向繼續探索。其中,DB 微服務化也是為了應對復雜性而誕生,可以將數據庫任何可分離的組件都實現服務化,打造 PB 級在線數據服務平臺,提供更高的規模效應、更好的容錯能力以及更強的風險控制手段。
在唐劉看來," 面向未來,任何可分離的數據庫組件都可實現微服務化,但同時也會帶來管理成本的復雜性問題。PingCAP 的策略是將這種管理的復雜性封裝在云上,提供給客戶的仍然是一體化的數據庫服務體驗。"
市場的回答
據悉,PingCAP 目前服務客戶超過 3000 家,覆蓋金融銀行、互聯網、物流、游戲、智能制造等行業。
建信金科基礎技術中心副總裁邢磊介紹,從 2020 年的 TiKV 分布式鍵值數據庫,到 2021 年的 Chaos Mesh 云原生混沌工程平臺,再到 2022 年的 TiDB HTAP 在業務系統的投產,PingCAP 以客戶成功、開源開放、面向未來的技術架構和服務體系,深入參與了建信金科系統升級,順利扛住 4 萬多 TPS 壓力,穩定運行。
百勝中國目前已經在用戶、支付、消息等業務中臺,以及企業財務系統中落地實施了 TiDB 等開源技術。百勝中國 CTO 張雷介紹,餐飲行業的交易存在明顯的高低峰場景,如旗下品牌肯德基的營銷活動 " 瘋狂星期四 " 的交易量遠超平常交易日,TiDB 的靈活水平擴展能力讓企業及時根據業務的需求對計算資源進行調整,助力降本增效。
某開源用戶企業的 CFO 對 TiDB 也有一定認可," 在支撐現有業務的情況下,能夠節省掉一半的人力成本。"
中國人壽財險核心系統目前也基于 TiDB 實現從集中式到分布式數據庫的升級改造,大幅提升海量數據和高并發情況下的業務處理性能。
PingCAP 副總裁陳煜琦向鈦媒體 APP 表示," 作為國內排名靠前的保險公司,國壽財險希望能夠在未來產生更多的增量價值,對業務的敏捷性和靈活性要求非常高,大概從兩年前國壽財險就開始與 PingCAP 進行合作。很多金融業客戶提到,他們希望能夠多一些選擇,而不是只綁定某家數據庫。在分布式數據庫這個賽道上,PingCAP 的技術優勢有一定的契合度。"
值得一提的是,在目前 PingCAP 著力出海的東南亞、日本、美國、歐洲等地區,會結合地域監管、區域用戶場景、行業和對云端應用的使用特征等維度,進行海外業務的拓展。據了解,PingCAP 尤其在過去一年已經拓展到了一些行業頭部的大型企業客戶。