歡迎來訪!廣西中立源能源技術(shù)有限公司
從區(qū)域格局來看,長三角地區(qū)屬于一個主體、多個子部分的結(jié)構(gòu)?!堕L三角區(qū)域一體化發(fā)展規(guī)劃綱要》要求“上海發(fā)揮龍頭作用,江浙滬皖發(fā)揮各自優(yōu)勢,加強(qiáng)跨區(qū)域協(xié)調(diào)互動”。
該數(shù)據(jù)庫已有60年的歷史。2020年之前,數(shù)據(jù)庫系統(tǒng)被美國壟斷,比如商用數(shù)據(jù)庫Oracle、DB2、SQLserver,以及開源數(shù)據(jù)庫PostgreSQL、MySQL。國產(chǎn)數(shù)據(jù)庫近年來也開始加大投入,逐步進(jìn)入國家核心系統(tǒng),如金融、證券等。雖然國產(chǎn)數(shù)據(jù)庫 Vendor的技術(shù)與Oracle相比還有差距,但目前來看,最重要的癥結(jié)并不是技術(shù)本身,而是數(shù)據(jù)庫生態(tài)的構(gòu)建。
數(shù)據(jù)庫生態(tài)是指基于DBMS軟件產(chǎn)品和服務(wù)的組織和個人之間相互作用形成的環(huán)境,如交流、合作、供需滿足等。一個成熟的數(shù)據(jù)庫生態(tài)系統(tǒng),不僅包括功能完善、性能優(yōu)異、運(yùn)行穩(wěn)定的系統(tǒng),還包括完整的文檔和知識庫、豐富多樣的開發(fā)和運(yùn)維工具鏈、典型應(yīng)用案例和評測報告,擁有一批經(jīng)驗豐富、熟悉系統(tǒng)的開發(fā)者和用戶。典型的數(shù)據(jù)庫生態(tài)系統(tǒng)包括以O(shè)racle、IBMDB2、MicrosoftSQLServer為代表的商用數(shù)據(jù)庫生態(tài)系統(tǒng),以MySQL、PostgreSQL為代表的開源數(shù)據(jù)庫生態(tài)系統(tǒng),以TPC為代表的事務(wù)性能基準(zhǔn)評測生態(tài)系統(tǒng)。數(shù)據(jù)庫是DBMS軟件產(chǎn)品穩(wěn)定持續(xù)發(fā)展和商業(yè)成功的關(guān)鍵,也是目前國產(chǎn)數(shù)據(jù)庫系統(tǒng)最欠缺的方面。
以下三個方面是我國數(shù)據(jù)庫生態(tài)建設(shè)的當(dāng)務(wù)之急。
1、數(shù)據(jù)庫評估基準(zhǔn)構(gòu)建
評測基準(zhǔn)是評價數(shù)據(jù)庫系統(tǒng)最重要的標(biāo)準(zhǔn),是數(shù)據(jù)庫系統(tǒng)選擇的重要依據(jù),也是推動數(shù)據(jù)庫系統(tǒng)研究和發(fā)展的主要動力之一。因此,可以說評測基準(zhǔn)是支撐數(shù)據(jù)庫行業(yè)健康發(fā)展40多年的最重要支柱之一。比如TPC系列基準(zhǔn)的出現(xiàn)和發(fā)展,使得很多關(guān)系數(shù)據(jù)庫管理系統(tǒng)廠商能夠在一個公平開放的環(huán)境中競爭。
在數(shù)據(jù)庫系統(tǒng)普遍適應(yīng)云計算平臺、采用分布式架構(gòu)、提供越來越多新的數(shù)據(jù)類型支持和新的數(shù)據(jù)管理和數(shù)據(jù)處理服務(wù)的場景下,以TPC系列為代表的現(xiàn)有評測基準(zhǔn)無法滿足當(dāng)前和未來系統(tǒng)比較、系統(tǒng)選擇、指導(dǎo)R&D、規(guī)范行業(yè)的需求。同時,作為企業(yè)和行業(yè)標(biāo)準(zhǔn)的基礎(chǔ)和前提,形成能夠反映我國應(yīng)用需求和系統(tǒng)廠商優(yōu)勢的評測基準(zhǔn),也是規(guī)范我國數(shù)據(jù)庫行業(yè),培育國產(chǎn)數(shù)據(jù)庫系統(tǒng)的前提。
分布式數(shù)據(jù)庫系統(tǒng)的正確性測試:新的數(shù)據(jù)管理系統(tǒng)一般采用分布式架構(gòu),以實(shí)現(xiàn)可擴(kuò)展性、高性能和高可用性。分布式架構(gòu)還帶來了支持分布式事務(wù)的復(fù)雜并發(fā)控制協(xié)議和支持高可用性和快速恢復(fù)的分布式共識協(xié)議。協(xié)議的正確性和項目實(shí)現(xiàn)的正確性將影響分布式數(shù)據(jù)庫系統(tǒng)的正確運(yùn)行。一套完整的分布式數(shù)據(jù)庫事務(wù)正確性測試方法和開放易用的測試工具對于推動分布式數(shù)據(jù)庫系統(tǒng)的研究和發(fā)展,促進(jìn)新的數(shù)據(jù)庫系統(tǒng)在關(guān)鍵任務(wù)應(yīng)用中的替代是必要的?,F(xiàn)有的評估工具無法實(shí)現(xiàn)這一目標(biāo)。
面向應(yīng)用的評價基準(zhǔn)構(gòu)建方法:隨著數(shù)據(jù)管理系統(tǒng)在信息系統(tǒng)中作用的提升,其應(yīng)用范圍和多樣性較其誕生時有了質(zhì)的飛躍。2014年圖靈獎得主MichaelStonebraker提出了經(jīng)典結(jié)論“Onesizedoesnotfitall!”還有邁克爾杰。Carey認(rèn)為數(shù)據(jù)庫系統(tǒng)的發(fā)展將呈現(xiàn)出“Onesizefitsabunch”的趨勢,即每一種具有相似特征或需求的應(yīng)用都需要不同的數(shù)據(jù)管理系統(tǒng)。近年來,國內(nèi)外涌現(xiàn)的新型數(shù)據(jù)庫系統(tǒng)驗證了這一趨勢的到來?!癘nesizefitsabunch”不僅要體現(xiàn)在新系統(tǒng)的出現(xiàn)上,還要體現(xiàn)在相應(yīng)的評測基準(zhǔn)上。TPC benchmark系列的精髓是使用“Onesizefitsall”模型來評估所有系統(tǒng)。然而,類似云環(huán)境、嵌入式環(huán)境、“現(xiàn)象級”事務(wù)處理、多模態(tài)數(shù)據(jù)管理,以及結(jié)合機(jī)器學(xué)習(xí)/AI的數(shù)據(jù)管理應(yīng)用,普遍缺乏開放、權(quán)威的評測基準(zhǔn)。一方面,設(shè)定一個涵蓋所有應(yīng)用需求的恒定基準(zhǔn)是昂貴的,另一方面,也難以適應(yīng)快速變化和發(fā)展的應(yīng)用場景。構(gòu)建典型應(yīng)用的評測基準(zhǔn),發(fā)展面向應(yīng)用的評測基準(zhǔn)構(gòu)建方法和理論,實(shí)現(xiàn)定制化的評測基準(zhǔn)構(gòu)建工具,是形成適合新型數(shù)據(jù)管理系統(tǒng)和應(yīng)用開發(fā)的評測基準(zhǔn),進(jìn)而為國產(chǎn)數(shù)據(jù)庫 industry的發(fā)展保駕護(hù)航的前提。
新數(shù)據(jù)庫系統(tǒng)的評估基準(zhǔn):新數(shù)據(jù)庫系統(tǒng)(云數(shù)據(jù)庫、分布式數(shù)據(jù)庫、AI原生數(shù)據(jù)庫等)的形態(tài)、服務(wù)提供模式和依賴的硬件環(huán)境。)變化很大。傳統(tǒng)的響應(yīng)延遲、系統(tǒng)吞吐量等性能評價指標(biāo)已經(jīng)不能準(zhǔn)確、全面地反映新系統(tǒng)的特性。比如,對于一個幾乎可以線性伸縮的系統(tǒng),無論是系統(tǒng)的最高吞吐率還是單機(jī)的平均吞吐率都不能反映系統(tǒng)的可伸縮性。應(yīng)用數(shù)據(jù)庫廠商和應(yīng)用數(shù)據(jù)庫廠商都迫切需要新的評測基準(zhǔn),能夠評測云服務(wù)能力、系統(tǒng)可擴(kuò)展性)/彈性)/可用性)/能耗和新硬件利用率。新的評價指標(biāo)和評價方法的制定需要應(yīng)用單位確認(rèn)其對系統(tǒng)比較和選擇的實(shí)際意義,也需要數(shù)據(jù)庫廠商的深度參與,以體現(xiàn)眾多系統(tǒng)的特點(diǎn)和優(yōu)勢。這項工作對于引導(dǎo)系統(tǒng)的研發(fā)方向,爭奪數(shù)據(jù)庫系統(tǒng)發(fā)展方向的話語權(quán)非常重要。
2、開源數(shù)據(jù)庫的生態(tài)建設(shè)
在開源數(shù)據(jù)庫系統(tǒng)的發(fā)展中起到了重要的作用:最早的關(guān)系數(shù)據(jù)庫系統(tǒng)之一的Ingres,誕生之初就是用BSD協(xié)議開源的;擁有廣泛用戶的MySQL和PostgreSQL都是開源系統(tǒng);安裝量最大的數(shù)據(jù)庫系統(tǒng)SQLite也是一個開源系統(tǒng)。而且,即使是Oracle、IBMDB2這樣的商業(yè)閉源數(shù)據(jù)庫系統(tǒng),也依賴于一個龐大的開源生態(tài)系統(tǒng),里面有很多開發(fā)和運(yùn)營工具。
開源數(shù)據(jù)庫的生態(tài)建設(shè)在以下五個方面具有重要意義:
開放技術(shù)和安全可靠性保障:關(guān)鍵核心任務(wù)的應(yīng)用對系統(tǒng)的安全性和可靠性要求極高。開源系統(tǒng)有助于安全審計、公開評估、及時發(fā)現(xiàn)和修復(fù)bug。
用戶反饋收集和經(jīng)驗積累:優(yōu)秀的系統(tǒng)是“用過的”,需要基于大量應(yīng)用的使用進(jìn)行優(yōu)化升級。開源有利于應(yīng)用推廣、問題反饋和收集,也為用戶提供了經(jīng)驗積累和交流的媒介。換句話說,開源社區(qū)將以眾包的形式圍繞數(shù)據(jù)庫系統(tǒng)構(gòu)建知識庫。對于新興的數(shù)據(jù)庫系統(tǒng)產(chǎn)品和廠商來說,這將大大節(jié)省廠商自己構(gòu)建知識庫的成本。
以及開發(fā)和運(yùn)維工具鏈建設(shè):數(shù)據(jù)庫系統(tǒng)只是應(yīng)用軟件棧中的一環(huán)。應(yīng)用設(shè)計開發(fā)、中間件適配、應(yīng)用運(yùn)維都需要專門的工具。由于數(shù)據(jù)管理系統(tǒng)的復(fù)雜性,適合一個系統(tǒng)的工具通常不適合其他系統(tǒng);由于應(yīng)用環(huán)境的復(fù)雜性,數(shù)據(jù)管理系統(tǒng)可能需要適應(yīng)不同應(yīng)用中的不同操作系統(tǒng)、中間件、開發(fā)環(huán)境或其他工具。對于一個數(shù)據(jù)庫系統(tǒng)廠商來說,尤其是新系統(tǒng),短時間內(nèi)搭建這樣一個工具鏈,成本是很大的。開源是積累社區(qū)力量,減少重復(fù)工作,構(gòu)建工具鏈的有效途徑。
用戶產(chǎn)業(yè)鏈的培育:數(shù)據(jù)庫系統(tǒng),尤其是新系統(tǒng),需要吸引用戶、應(yīng)用開發(fā)者和服務(wù)提供商。開源是消除系統(tǒng)神秘感、宣傳系統(tǒng)、培養(yǎng)潛在用戶、構(gòu)建開發(fā)、集成、運(yùn)維產(chǎn)業(yè)鏈的有效手段。
R&D人才教育和技術(shù)探索:數(shù)據(jù)庫系統(tǒng)的核心R&D需要大量經(jīng)過系統(tǒng)培訓(xùn)的R&D人才。R&D人員不僅需要豐富的理論知識積累,還需要大量的工程實(shí)踐。開源系統(tǒng)是閱讀優(yōu)秀代碼、實(shí)現(xiàn)理論驗證和工程實(shí)踐訓(xùn)練、探索新方法和新技術(shù)的最佳載體,從而形成研究成果驗證和轉(zhuǎn)化的最佳載體。
以上五個方面的需求包括數(shù)據(jù)庫廠商、應(yīng)用單位、R&D機(jī)構(gòu),以及個人研究人員和工程師,從核心技術(shù)研發(fā)、問答和文檔建設(shè),乃至社區(qū)文化建設(shè)都進(jìn)行了長期投入,從而形成圍繞數(shù)據(jù)庫系統(tǒng)產(chǎn)品的開源社區(qū)。
3、產(chǎn)學(xué)研用深度合作
數(shù)據(jù)庫涉及的技術(shù)鏈條長,內(nèi)部模塊耦合度高,與軟件棧和硬件平臺的其他部分關(guān)聯(lián)度高。無論是數(shù)據(jù)庫系統(tǒng)的核心研發(fā)、評測基準(zhǔn)的構(gòu)建,還是開源生態(tài)的建設(shè),都需要產(chǎn)學(xué)研各方的緊密合作。
近年來,華為GaussDB、PingCAPTiDB、奧星貝斯Oceanbase、阿里PolarDB等國產(chǎn)數(shù)據(jù)庫系統(tǒng)都開始通過開源構(gòu)建多方參與的社區(qū)生態(tài)。同時,數(shù)據(jù)庫廠商也通過項目與高校和科研院所進(jìn)行了廣泛的合作。代表性的合作計劃有CCF-華為數(shù)據(jù)庫創(chuàng)新研究項目、騰訊犀牛鳥項目、阿里Air項目等。這些項目使制造商和研究機(jī)構(gòu)形成了相對穩(wěn)定和密切的合作關(guān)系。
數(shù)據(jù)庫系統(tǒng)的發(fā)展越來越具有“應(yīng)用驅(qū)動創(chuàng)新”的特征。系統(tǒng)的開發(fā)受到應(yīng)用需求的刺激和驅(qū)動。目前,在數(shù)據(jù)庫系統(tǒng)研發(fā)和生態(tài)建設(shè)方面,數(shù)據(jù)庫系統(tǒng)廠商與高校、科研院所等研究機(jī)構(gòu)的合作較多,同時系統(tǒng)廠商與應(yīng)用方也有密切的合作。然而,在聯(lián)合參與的產(chǎn)學(xué)研合作方面仍然不多。與美歐等先進(jìn)高校和科研院所相比,我國的科研院所面對R&D系統(tǒng)原型的應(yīng)用,再通過開源或企業(yè)合作的方式進(jìn)行孵化或轉(zhuǎn)化,從而形成一條具有較大影響力的數(shù)據(jù)管理系統(tǒng)產(chǎn)品研發(fā)之路,仍需探索。這不僅需要多方合作模式的創(chuàng)新,也需要我國科研機(jī)構(gòu)的成果和研究績效評價機(jī)制的創(chuàng)新。
“學(xué)”:學(xué)校要承擔(dān)人才培養(yǎng)和引領(lǐng)研究的使命。(1)在本科生培養(yǎng)中,不僅要教會學(xué)生什么是數(shù)據(jù)庫,如何使用數(shù)據(jù)庫,還要教會學(xué)生如何設(shè)計數(shù)據(jù)庫,為什么要設(shè)計數(shù)據(jù)庫,讓本科生知道為什么。此外,高校還應(yīng)推動國產(chǎn)數(shù)據(jù)庫進(jìn)入課堂,讓學(xué)生更多地了解和體驗國產(chǎn)數(shù)據(jù)庫以及如何使用國產(chǎn)數(shù)據(jù)庫 system,逐步形成一系列實(shí)驗。在理論教學(xué)的同時開展工程實(shí)踐教育和研究性教學(xué)還有待進(jìn)一步研究。雖然國內(nèi)開源數(shù)據(jù)庫在進(jìn)入計算機(jī)等專業(yè)教學(xué)體系時還處于探索階段,但正通過教育部產(chǎn)學(xué)合作教育項目積極推進(jìn)。(2)在研究生培養(yǎng)方面,教師也要深入了解企業(yè)界的需求,凝練有價值的題型,帶領(lǐng)學(xué)生做那些“真、難、重”的重要挑戰(zhàn)性題型,即數(shù)據(jù)庫系統(tǒng)中重要的、真實(shí)的、有挑戰(zhàn)性的、共性的基礎(chǔ)題型。學(xué)校也要承擔(dān)起引領(lǐng)科研的使命,突破“0到1”的難題,引領(lǐng)行業(yè)未來發(fā)展。
“研”:科研機(jī)構(gòu)主要負(fù)責(zé)克服當(dāng)前瓶頸的基礎(chǔ)性、共性關(guān)鍵問題,如分布式事務(wù)與Paxos的集成、全局高可用等技術(shù),解決當(dāng)前具有挑戰(zhàn)性的問題。學(xué)校和科研機(jī)構(gòu)也要深度合作,推動領(lǐng)先技術(shù)的研究和落地。
“產(chǎn)”:數(shù)據(jù)庫R&D企業(yè)應(yīng)承擔(dān)開發(fā)國產(chǎn)數(shù)據(jù)庫的使命。他們一方面要解決數(shù)據(jù)庫卡脖子的問題,另一方面要推動技術(shù)創(chuàng)新和進(jìn)步,給數(shù)據(jù)庫用戶帶來新的價值。目前,OLTP存在一些問題,如穩(wěn)定性、生態(tài)性、兼容性等。企業(yè)界應(yīng)該堅持解決這些核心問題。此外,還有許多新的數(shù)據(jù)庫,如圖表、時間序列、流、多模態(tài)等。這也需要百花齊放,百家爭鳴。
“用”:數(shù)據(jù)庫用戶不要簡單的要求更換數(shù)據(jù)庫提供商“apple2apple”,而是要通過數(shù)據(jù)庫升級迭代來引領(lǐng)產(chǎn)品和應(yīng)用的發(fā)展,從未來的角度來看待數(shù)據(jù)庫的升級。數(shù)據(jù)庫用戶也要思考為“產(chǎn)、學(xué)、研”提供有價值、有前景的應(yīng)用“真實(shí)”需求,推動國產(chǎn)數(shù)據(jù)庫 field的跨越式發(fā)展。
4、總結(jié)
數(shù)據(jù)庫生態(tài)建設(shè)是推動國產(chǎn)數(shù)據(jù)庫系統(tǒng)和產(chǎn)業(yè)健康發(fā)展的關(guān)鍵,也是推動國產(chǎn)數(shù)據(jù)庫系統(tǒng)助力產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型,實(shí)現(xiàn)關(guān)鍵核心任務(wù)對國外商用數(shù)據(jù)庫系統(tǒng)替代的關(guān)鍵。
數(shù)據(jù)庫生態(tài)的建設(shè)需要開發(fā)新應(yīng)用場景的評估方法和工具,構(gòu)建一個積極參與、緊密互動、持續(xù)成長的社區(qū),培育包括用戶、產(chǎn)業(yè)鏈廠商、R&D梯隊在內(nèi)的社區(qū)團(tuán)隊。對于開發(fā)歷史較短的國產(chǎn)數(shù)據(jù)庫系統(tǒng)廠商來說,開源是構(gòu)建這樣一個生態(tài)系統(tǒng)的重要途徑。
圍繞數(shù)據(jù)庫系統(tǒng)開展產(chǎn)學(xué)研用戶的緊密合作才剛剛開始。在現(xiàn)有開源、項目化合作的基礎(chǔ)上,還需要做大量的工作引入應(yīng)用端,同時將合作延伸到基礎(chǔ)人才的培養(yǎng),探索出一條國產(chǎn)數(shù)據(jù)庫系統(tǒng)R&D和生態(tài)建設(shè)的新路。
聯(lián)系人:陳先生
服務(wù)熱線:158 7870 3621
CopyRight 廣西中立源能源技術(shù)有限公司 All Rights Reserved. 桂ICP備2022001346號 a>
電子郵箱:1291250037@qq.com
聯(lián)系地址:廣西南寧市青秀區(qū)賢賓路一號五樓