電腦版
首頁

搜尋 繁體

三、資料庫進入全新階段

熱門小說推薦

在網際網路誕生初期,資料庫主要的型別是關係型資料庫,這是一種採用了關係模型來組織資料的資料庫。這是在1970年由IBM研究員埃德加·弗蘭克·科德(E.F.Codd)博士首先提出的,在之後的幾十年中,關係模型的概念得到了充分的發展並逐漸成為主流資料庫結構的主流模型。簡單來說,關係模型指的就是二維表格模型,而一個關係型資料庫就是由二維表及其之間的聯絡所組成的一個數據組織。

隨著網際網路Web2.0網站的興起,傳統的關係資料庫在應對Web2.0網站,特別是超大規模和高併發的SNS型別的Web2.0純動態網站已經顯得力不從心,暴露了很多難以克服的問題,而NoSQL的資料庫則由於其本身的特點得到了非常迅速的發展。NoSQL泛指非關係型的資料庫,它的產生就是為了解決大規模資料集合多重資料種類帶來的挑戰,尤其是大資料應用難題。

以谷歌為例,谷歌公司大資料三篇著名論文(GFS,Bigtable,MapReduce)奠定了谷歌大資料的基礎,而谷歌的Pagerank演算法實現了當時幾乎最先進的資料搜尋演算法。PageRank透過網路浩瀚的超連結關係來確定一個頁面的等級。谷歌把從A頁面到B頁面的連結解釋為A頁面給B頁面投票,谷歌根據投票來源(甚至來源的來源,即連結到A頁面的頁面)和投票目標的等級來決定新的等級。簡單地說,一個高等級的頁面可以使其他低等級頁面的等級得到提升。而這個技術正是本章所指的資料第二階段,透過複雜的設計網路和演算法進行重新整理和歸納,將原本看似並無關聯的資料變為可以分級分類的高質量資料,讓大資料和複雜網路模型成為可能。

但是構建在這之上的大資料,最大的問題就是無法解決信任問題。因為網際網路使得全球之間的互動越來越緊密,與之相伴而來的就是巨大的信任鴻溝。現有的主流資料庫技術架構都是私密且中心化的,在這個架構上是永遠無法解決價值轉移和互信的問題。所以區塊鏈技術將成為下一代資料庫架構,透過去中心化技術,將能夠在大資料的基礎上完成全球互信這個巨大的進步。

區塊鏈技術作為一種特定分散式存取資料技術,透過網路中多個參與計算的節點展開共同參與資料的計算和記錄,並且互相驗證其資訊的有效性(防偽)。從這一點來看,區塊鏈技術也是一種特定的資料庫技術。這種資料庫將會實現梅蘭妮·斯旺(Melanie Swan)所說的第三種資料型別,即能夠獲得基於全網共識為基礎的資料可信性。目前,網際網路剛剛進入大資料時代,還處於初期階段。但是當進入到區塊鏈資料庫階段,將進入到真正的強信任背書的大資料時代。這裡面的所有資料都可以獲得堅不可摧的質量,任何人都沒有能力也沒有必要去質疑。

圖9.2 區塊鏈資料庫的優勢

從前面的發展我們可以注意到,資料的發展和馬斯洛需求層次理論有些接近,在實現了生存和使用的需求後,自然會朝著更高的需求進行發展。當然,安全僅僅是資料發展中的一個階段,而最終會朝著人工智慧這個資料自我實現的需求發展。儘管我們還不能確定當資料能夠實現人工智慧,甚至是資料自我智慧時,資料庫會是怎樣的形態,也許未來的人工智慧資料庫會變成像電影《復仇者聯盟》中的賈維斯和奧創這樣的形態吧。

最近更新小說

最重要的小事