第一千三百七十八章思維體系(第2頁)

 

直到周至穿越回來之前，國家將典籍進行數字化的工作，主要還停留在建立樹狀數據庫的較為原始的應用階段。

就好比一個標準的圖書館，將一本書作為一個文本文件整體存放，然後給這個文件編出，書名，書號，最多再給出個作者，出版社之類的信息，作為標籤。

這樣做的好處就是簡單明瞭，升級維護也容易，信息保存也算全面，一句話說完，就是夠用，但不好用。

這樣的東西在周至眼裡當然是不合格的，最多最多隻能算是地基，離百尺高塔還差著老遠的功夫。

信息工程就是這樣，算法和協議的思路，往往比基礎工作還要重要，如果指導思想發生了錯誤，等到工程進展到不敷使用，才想著改弦易轍，在已經疊房架屋的情況下，再要開展，將付出巨大的代價。

後世中文編碼的巨大混亂情形，就是這種教訓的最好註腳。

這些思路，是在四葉草的研發思想，周至提出來的“如何三問”原則思想指導下梳理出來的。

“如何三問”聽著玄奧，其實很簡單質樸，就是對於任何需求，我們要問三層以上的問題。

比如典籍數字化工程，按照一般的思路，好不好用？

答案肯定：不好用。

那第一個如何就來了：如何讓它好用？

答案也簡單：除了將一部部書籍掃描成文本文檔外，還要在這個基礎上，建立起一個龐大的標籤體系和智慧搜索引擎。

那第二個如何就來了：如何建立起一個龐大的標籤體系和智慧搜索引擎？

答案就是需要一個能夠根據文檔內容，自動化地分析提取特徵標籤的標籤採集軟件；要完成智慧搜索引擎，又需要一個球網狀的數據拓撲關聯繫統。

那第三個如何就來了：我們如何開發這個標籤採集軟件和球網狀的數據拓撲關聯繫統。

答案就是軟件硬件並行，軟件上，利用現在最新的數學統計學原理，引入計算機模型當中，開發出一套特徵提取算法和特徵聯動算法，並將這套算法作為指導思想，完成軟件開發。

硬件上，要克服現有計算設備算力不足的情況，就利用網絡時代的助力，將廣域網上的所有算力資源都最大程度地利用起來，研發出基於互聯網基礎的分佈式算力應用系統。

第一千三百七十八章 思維體系(第2頁)