提高人工智能時代口述史研究水平(學術隨筆)
作為一門古老的學科,歷史學的旺盛生命力源于其開放性。習近平總書記指出:“人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,將對全球經(jīng)濟社會發(fā)展和人類文明進步產(chǎn)生深遠影響!碑斍埃斯ぶ悄茉谡Z音識別、自然語言處理、機器學習、計算機視覺、知識圖譜、機器翻譯、大數(shù)據(jù)挖掘等方面的突破與應用,不僅深刻改變著人類社會的方方面面,也為歷史學的繁榮發(fā)展插上了數(shù)字翅膀,注入了新的生機與活力。作為歷史學的分支學科,口述史也迎來了人工智能帶來的前所未有的機遇與挑戰(zhàn)。我們要積極擁抱新技術,用創(chuàng)新的眼光和開放的胸襟去探索人工智能在口述史研究中的具體應用路徑,把握好人工智能在采集、整理、保存、分析、傳播等環(huán)節(jié)對口述史研究的賦能作用。
在采集環(huán)節(jié),人工智能有望徹底改變傳統(tǒng)的訪談模式,實現(xiàn)口述史采集的智能化。以訪談形式采集、整理與保存口述者的歷史記憶,并呈現(xiàn)口述者親歷的歷史真實,是口述史研究的重要旨歸。隨著自然語言處理、知識圖譜、情感計算等技術的進步,目前已經(jīng)開發(fā)出一批虛擬訪談助理、對話式助理等人工智能系統(tǒng)。這些人工智能系統(tǒng)以人機對話的方式與受訪者互動,根據(jù)受訪者的特點自動生成個性化訪談提綱,并根據(jù)訪談進程實時調(diào)整問題的內(nèi)容和順序。此外,虛擬現(xiàn)實和增強現(xiàn)實等沉浸式技術可以讓受訪者“穿越”回特定的時空情境,身臨其境地重溫當年的人和事,為口述史采集營造身臨其境的氛圍,激發(fā)受訪者更多的記憶和情感共鳴。
在整理環(huán)節(jié),人工智能在轉(zhuǎn)錄、編目和索引等方面顯著提高效率和質(zhì)量,實現(xiàn)口述史整理的自動化。在口述史研究中,對訪談內(nèi)容的整理至關重要,無論是文獻整理、文字整理還是影音整理,都有著一套嚴格的操作規(guī)程。隨著語音識別、自然語言處理、知識圖譜等技術的發(fā)展,口述史整理全流程的自動化處理日益成為可能。在轉(zhuǎn)錄方面,智能語音識別程序可以自動將口述音頻轉(zhuǎn)化為文本,并進行智能標點、分段、生成時間戳和說話人標記等處理,大幅提高轉(zhuǎn)錄效率,同時也降低了人工轉(zhuǎn)寫的成本與錯誤率。在編目和索引方面,自然語言處理和知識圖譜技術通過命名實體識別、關鍵詞提取、主題聚類等算法,能夠自動識別和提取口述史資料中的主題、關鍵詞、人名、地名、時間等重要信息,按照預定義的規(guī)則和標準生成元數(shù)據(jù),建立資料目錄和索引。
在保存環(huán)節(jié),人工智能改變口述史的保存方式和管理模式,進而提升其安全系數(shù)、管理效率與利用水平。海量口述史資料的數(shù)字化保存面臨諸多挑戰(zhàn),如存儲空間不足、檢索效率低下與數(shù)據(jù)安全隱患等。人工智能為破解這些難題提供了新思路與新方法。比如,智能化的數(shù)據(jù)壓縮和存儲技術可以大幅降低口述史資料的存儲成本,區(qū)塊鏈技術等可以為相關資料提供更加安全可信的存儲環(huán)境;人工智能可以自動提取口述史資料的語義特征,構建多維度、細粒度的索引,實現(xiàn)智能化檢索,從而顯著提升其利用效率。人工智能的有效應用使得海量口述史資料長期保存和智能化管理更為便利、可行,從技術層面延續(xù)了口述史的生命力。
在分析環(huán)節(jié),人工智能提供了新的研究工具和方法,有助于開辟口述史研究的新范式與新路徑。傳統(tǒng)的口述史研究在分析環(huán)節(jié)主要依賴研究者的主觀解讀和歷史想象力,著重強調(diào)對個體經(jīng)驗的描述和詮釋,而人工智能的引入則為口述史分析提供了更多定量分析和數(shù)據(jù)驅(qū)動的研究工具和方法。這些研究工具和方法包括:可以實現(xiàn)口述史資料的智能化解析的自然語言處理技術,能夠幫助研究者發(fā)現(xiàn)口述史資料中隱性知識和深層關系的知識圖譜和語義網(wǎng)絡技術,可以幫助研究者從海量口述史資料中發(fā)現(xiàn)有價值的模式和趨勢的數(shù)據(jù)挖掘和機器學習技術,等等。人工智能不僅是口述史分析的工具和方法,更是口述史研究范式轉(zhuǎn)變和創(chuàng)新的催化劑,將推動口述史研究從傳統(tǒng)的人文解釋學范式向數(shù)據(jù)密集型、技術驅(qū)動型的新范式轉(zhuǎn)變。
在傳播環(huán)節(jié),人工智能開辟了一系列新的呈現(xiàn)模式與途徑,有助于創(chuàng)造更加大眾化、交互化、沉浸化的口述史體驗。人工智能與數(shù)字人文的結合開辟了口述史傳播的新路徑、新方式、新格局。比如,智能展示技術可以創(chuàng)新呈現(xiàn)方式,沉浸式現(xiàn)實、虛擬人、體感交互等技術的發(fā)展有助于打造身臨其境的口述史沉浸體驗;再如,智能推薦技術可以實現(xiàn)精準傳播,人工智能系統(tǒng)可以采集用戶的瀏覽行為、興趣偏好等數(shù)據(jù),利用協(xié)同過濾、內(nèi)容過濾等算法,自動為其推送相匹配的口述史內(nèi)容,提高傳播的精準度和轉(zhuǎn)化率;等等。
可以預見,在不遠的將來,人工智能與口述史的融合將會更加深入,促進口述史研究觀念、方法、路徑與模式等的全方位創(chuàng)新,讓口述史煥發(fā)出前所未有的生機與活力。然而,我們也要清醒地認識到,人工智能并非口述史發(fā)展的“靈丹妙藥”,在帶來重大機遇的同時也帶來了諸多挑戰(zhàn),比如,如何確保口述史資料的真實性與代表性,如何避免著作權侵犯、隱私泄露、數(shù)據(jù)濫用等風險,如何避免算法模型的偏見和誤讀,如何平衡技術應用與人文關懷,如何應對數(shù)字鴻溝帶來的不平等,等等。這些都是口述史研究在擁抱人工智能的同時必須慎重對待的問題。面向未來,我們既要借助人工智能提高研究水平和創(chuàng)新能力,也要堅守人文情懷和學術操守,以歷史學的學理自覺引領技術應用,實現(xiàn)人機協(xié)同、優(yōu)勢互補,拓展研究的智能化實踐,打造研究與應用的廣闊前景與全新境界。
。ㄗ髡邽橹袊嗣翊髮W歷史學院教授)
《 人民日報 》( 2024年07月29日 09 版)
分享讓更多人看到