9月18日,由鳳凰傳媒牽頭、江蘇人民出版社聯(lián)合同方知網(wǎng)數(shù)字科技有限公司共同打造的“抗戰(zhàn)史人工智能數(shù)據(jù)庫”在南京正式上線。
“抗戰(zhàn)史人工智能數(shù)據(jù)庫”依托大模型、知識圖譜、OCR 識別、語義理解等核心技術(shù),將中國抗戰(zhàn)有關(guān)的圖書資源及期刊文獻(xiàn)進(jìn)行一系列數(shù)字化加工、結(jié)構(gòu)化標(biāo)引、知識細(xì)粒度處理、內(nèi)部資源管理、多元化應(yīng)用服務(wù)、智能問答與可視化展示等處理,構(gòu)建成集資源管理、學(xué)術(shù)研究、教育普及、展示傳播、智能服務(wù)于一體的“抗戰(zhàn)知識服務(wù)平臺”。
鳳凰出版?zhèn)髅郊瘓F(tuán)黨委書記、董事長章朝陽在致辭中表示,運(yùn)用現(xiàn)代科技手段,對浩如煙海的抗戰(zhàn)史料進(jìn)行系統(tǒng)的、搶救性的數(shù)字化整合與開發(fā),打造一個權(quán)威、全面的資源平臺非常重要,“抗戰(zhàn)史人工智能數(shù)據(jù)庫”在搭建中一方面力求內(nèi)容的權(quán)威性與系統(tǒng)性,另一方面注重技術(shù)的先進(jìn)性與便捷性,此外,該數(shù)據(jù)庫還凸顯了教育的功能與時代性,引導(dǎo)讀者進(jìn)一步深入學(xué)習(xí)和了解抗戰(zhàn)史。
同方知網(wǎng)數(shù)字科技有限公司總經(jīng)理張宏偉表示,“抗戰(zhàn)史人工智能數(shù)據(jù)庫”是人工智能與出版深度融合的一次重要突破。它絕非簡單的史料數(shù)字化,而是以人工智能技術(shù)為核心,對海量歷史資源進(jìn)行深度挖掘、智能關(guān)聯(lián)和知識重構(gòu)的成果。它提升了歷史研究的效率與深度,拓展了歷史知識的傳播邊界。數(shù)據(jù)庫的上線發(fā)布,標(biāo)志著抗戰(zhàn)史研究從傳統(tǒng)文獻(xiàn)檢索模式邁向問答式知識服務(wù)新范式。
江南大學(xué)原黨委書記、南京大學(xué)中華民國史研究中心主任朱慶葆從學(xué)術(shù)的角度談?wù)撛摂?shù)據(jù)庫的價值所在,“我作為一名長期從事中華民國史,尤其是抗戰(zhàn)史研究和教學(xué)的工作者,深知史料是歷史理論的基石,是連接過去與未來的橋梁,抗戰(zhàn)史人工智能數(shù)據(jù)庫的建設(shè)回應(yīng)了在新的時代條件下,歷史資源如何保存、如何發(fā)揮資政育人、啟迪未來作用的時代課題,這不僅是一個技術(shù)工程,更是一條承載深遠(yuǎn)歷史意義和文化使命的工程?!?/p>
南京大學(xué)圖書館黨總支書記羅鈞同樣肯定了抗戰(zhàn)史人工智能數(shù)據(jù)庫的建設(shè)回應(yīng)了時代的需求,“對珍貴史料利用數(shù)字化手段使其煥發(fā)新的生命力,服務(wù)于學(xué)術(shù)研究、社會教育和文化傳播是我們面臨的重要課題和時代機(jī)遇,抗戰(zhàn)史人工智能數(shù)據(jù)庫匯聚大量珍貴史料,不僅有效延長了文獻(xiàn)的生命周期,更是為學(xué)界和社會公眾構(gòu)建了一個內(nèi)容全面、結(jié)構(gòu)清晰的抗戰(zhàn)史資料體系”。
南京市社科聯(lián)主席、黨組書記曹勁松從社科工作者的角度,認(rèn)為抗戰(zhàn)史人工智能數(shù)據(jù)庫有助于促進(jìn)人文經(jīng)濟(jì)中知識庫價值鏈的拓展,“根據(jù)不同主題構(gòu)建數(shù)字知識庫,既是人文經(jīng)濟(jì)在滿足人們自身知識構(gòu)建和精神成長的現(xiàn)實需求,又是文明發(fā)展在促進(jìn)人類知識積累和探索創(chuàng)新的智慧驅(qū)動,成為數(shù)字時代人們從技術(shù)生存走向智慧生存的基礎(chǔ)性建設(shè)”。
抗戰(zhàn)史人工智能數(shù)據(jù)庫內(nèi)容非常豐富,總文字體量超億字,其中不乏名著名作,包括《南京大屠殺史料集》《抗日戰(zhàn)爭專題研究叢書》《抗戰(zhàn)為什么贏》《抗戰(zhàn)旗幟毛澤東》等。其功能分成四個板塊,智能檢索板塊對史料進(jìn)行數(shù)字化處理,利用數(shù)字化加工工具和AI工具對這些文本進(jìn)行了語義分析、分類和索引,提取關(guān)鍵詞、主題,用向量空間模型,語義相似度計算等技術(shù)以自然語言形式生成回答。知識圖譜板塊利用先進(jìn)的自然語言處理技術(shù),從文獻(xiàn)等相關(guān)知識中獲得的大量抽取有價值的知識信息,識別出具有特定意義的實體,提供面向知識圖譜構(gòu)建的智能化輔助。時間軸板塊將人物、事件、機(jī)構(gòu)、地理的三元關(guān)系中的時間屬性進(jìn)行梳理和標(biāo)引,按照時間的演進(jìn),把重大歷史事件、歷史人物生平中涉及的各類實體和實體關(guān)系展示出來??箲?zhàn)搜問板塊為用戶提供智能問答服務(wù),并從全文數(shù)據(jù)庫中提取知識片段,為用戶提供簡潔明了的答案,回答真實可信,并提供知識溯源、圖書溯源、相關(guān)文獻(xiàn)、推薦圖片、推薦問題、專題問答等服務(wù),這是全國首個具有智能化功能的抗戰(zhàn)史數(shù)據(jù)庫。
未來,抗戰(zhàn)史人工智能數(shù)據(jù)庫將走進(jìn)博物館、圖書館和各類學(xué)校中,為廣大用戶提供服務(wù)。
揚(yáng)子晚報|紫牛新聞記者 沈昭
視頻|沈昭