二子從周 作品

第一千三百七十八章 思維體系(第2頁)

直到周至穿越回來之前,國家將典籍進行數字化的工作,主要還停留在建立樹狀數據庫的較為原始的應用階段。

就好比一個標準的圖書館,將一本書作為一個文本文件整體存放,然後給這個文件編出,書名,書號,最多再給出個作者,出版社之類的信息,作為標籤。

這樣做的好處就是簡單明瞭,升級維護也容易,信息保存也算全面,一句話說完,就是夠用,但不好用。

這樣的東西在周至眼裡當然是不合格的,最多最多隻能算是地基,離百尺高塔還差著老遠的功夫。

信息工程就是這樣,算法和協議的思路,往往比基礎工作還要重要,如果指導思想發生了錯誤,等到工程進展到不敷使用,才想著改弦易轍,在已經疊房架屋的情況下,再要開展,將付出巨大的代價。

後世中文編碼的巨大混亂情形,就是這種教訓的最好註腳。

這些思路,是在四葉草的研發思想,周至提出來的“如何三問”原則思想指導下梳理出來的。

“如何三問”聽著玄奧,其實很簡單質樸,就是對於任何需求,我們要問三層以上的問題。

比如典籍數字化工程,按照一般的思路,好不好用?

答案肯定:不好用。

那第一個如何就來了:如何讓它好用?

答案也簡單:除了將一部部書籍掃描成文本文檔外,還要在這個基礎上,建立起一個龐大的標籤體系和智慧搜索引擎。

那第二個如何就來了:如何建立起一個龐大的標籤體系和智慧搜索引擎?

答案就是需要一個能夠根據文檔內容,自動化地分析提取特徵標籤的標籤採集軟件;要完成智慧搜索引擎,又需要一個球網狀的數據拓撲關聯繫統。

那第三個如何就來了:我們如何開發這個標籤採集軟件和球網狀的數據拓撲關聯繫統。

答案就是軟件硬件並行,軟件上,利用現在最新的數學統計學原理,引入計算機模型當中,開發出一套特徵提取算法和特徵聯動算法,並將這套算法作為指導思想,完成軟件開發。

硬件上,要克服現有計算設備算力不足的情況,就利用網絡時代的助力,將廣域網上的所有算力資源都最大程度地利用起來,研發出基於互聯網基礎的分佈式算力應用系統。