二子從周 作品

第兩千兩百九十二章 向世界發出我們自己的聲音

現在的網絡信息管理還不太規範,各大院校搭建的數字圖書館其實存在很多的漏洞,用戶可以通過這些漏洞,獲取到圖書館中最高級權限才能訪問到的資料。

僅僅是利用系統漏洞獲取高級用戶權限和斷點續傳軟件,從對方服務器批量拷貝信息而已,和後世臭名昭著的「爬蟲」技術那種隱私、商密、著作權等知識產權的大敵還是有很大的區別的。

不過現在就連最基本款的反剽竊roBots協議都還沒有在業內出現,擁有對操作系統長足研究經驗,對各系統諸多漏洞有著最全面把握的四葉草公司,自然也就用不著和誰客氣。

但這畢竟還是一種雖然不受法律規範約束,但明顯不大值得稱讚的「搬運」行為,因此宋主任和周至在聊到這個的時候,都有了一些「偷感」。

「現在我們重點在搬運島京大學的漢文化數據庫和哥大的《古今圖書集成》。」周至說道:「其實一開始我們也不是想要搬運的,關鍵是這些院校對於漢語典籍的保管方式,現在還停留在掃描件的程度,說是數字化,其實只建立了索引目錄,內容還是一頁頁的圖像資料,這樣的資料只有保存上的意義,完全沒有信息處理的能力和價值。按照四葉草公司的定義,這些只能和典籍本身一樣歸類於非數資料,不屬於數字資料的範疇。」

「所以我估計很多院校圖書館其實是樂見我們搬運的,因為我們將這些資料搬運過來以後,會通過影像匹配軟件將之轉化為真正的數字化典籍,並且進入圖數據庫,與其他典籍一起構架起標籤關聯體系,成為我們的數字圖書館的一個組成部分。」

「而這個數字圖書館,我們是對外進行開放的,我們甚至還建立了一個可視化,可定製化的數據加工工具,給擁有一定編程基礎,不滿足於簡單使用搜索引擎的用戶,提供一些可編程接口,讓他們能夠用自己編寫的檢索程序,挖掘數字圖書館的功能。」

「對於這些程序我們會有一個標準的工藝文件介紹,而且在通過上線要求後,會共享給所有用戶。」