電腦版
首頁

搜尋 繁體

第兩千兩百三十四章 工具和專案

熱門小說推薦

最近更新小說

<!--go-->

“簡單舉一個例子,比如‘東坡’二字,在歷史典籍裡隨時會出現,只有在作為主語和賓語,而且謂語為人可以施行或者接受的動作的時候,我們才可以大體判定這裡的‘東坡’是指人。”

“因此‘與東坡同醉’,這樣的語句我們可以粗判為與蘇軾有關,而‘醉於東坡’,東坡不是賓語,我們就讓程式認為與蘇軾無關。”

“當然也有兩可之間的,例如‘東坡有田’,這一類語句就還需要擴充套件判定,這底下涉及到一整套的句法分析邏輯。”

“最後我們會得到這麼一批和蘇軾有關的子標籤,還有一批與其關連較為緊密的關係人,比如這裡的‘蘇洵’,‘蘇轍’,‘王弗’,‘宋仁宗’,‘曹太后’,‘章惇’等。”

“我們暫時先遮蔽掉這類人物標籤,僅透過之前的‘軾’,‘子瞻’,‘東坡’三個標籤來確定子標籤,開始在文庫當中檢索。”周至熟練地操作和講解道:“看,最終我們就會得到幾千條與蘇東坡有關的資料。”

“當然了,我給幾位老師展示的是以前的專案,這是運算後的結果,具體的真實運算過程還是需要一些時間的,不可能這麼快。”

“在這幾千條記錄當中,我們可以分作幾類。”周至一敲鍵盤,數千條記錄,分出了好幾種顏色。

“一類是包含時間的,一類是包含地點的,一類是包含官職的。”周至再一敲鍵盤,三類資料開始重新排列聚合:“我們根據蘇軾的職官、任職地變化,宋史年號,用字用號的變化等等,便能夠將這數千條記錄排出一個《蘇東坡行狀》,並在此基礎上排出一個《東坡軼事彙編》。”

Loading...

未載入完,嘗試【重新整理】or【關閉小說模式】or【關閉廣告遮蔽】。

嘗試更換【Firefox瀏覽器】or【Chrome谷歌瀏覽器】開啟多多收藏!

移動流量偶爾打不開,可以切換電信、聯通、Wifi。

收藏網址:www.peakbooks.cc

(>人<;)