国产综合区,欧产日产国产精品,亚洲日本色,国产欧美日韩一区

媒體

【江蘇科技報(bào)】數(shù)字模型助推非遺可持續(xù)發(fā)展

南京農(nóng)業(yè)大學(xué)王東波教授團(tuán)隊(duì)首推非物質(zhì)文化遺產(chǎn)大語言模型

2024-11-02來源:南農(nóng)新聞-NJAU NEWS作者:南京農(nóng)業(yè)大學(xué) 趙志梟 江蘇科技報(bào)記者 梁艷

本報(bào)訊(通訊員趙志梟記者梁艷)在大語言模型技術(shù)日新月異的今天,大語言模型的飛速發(fā)展正深刻改變著各行各業(yè)的面貌,非物質(zhì)文化遺產(chǎn)的數(shù)字化保護(hù)與傳承迎來了新的機(jī)遇。日前,在《中國世界級(jí)非遺文化悅讀系列》叢書發(fā)布會(huì)上,南京農(nóng)業(yè)大學(xué)信息管理學(xué)院王東波教授團(tuán)隊(duì)聯(lián)合南京大學(xué)“術(shù)語與翻譯跨學(xué)科研究”基地,推出非遺領(lǐng)域大語言模型,為非遺文化的保護(hù)與傳播開辟了新路徑。

非物質(zhì)文化遺產(chǎn)傳承以口頭傳播為主,由于其內(nèi)容豐富而形式多樣,在傳承過程中極易隨著時(shí)間流逝而丟失。非遺領(lǐng)域大語言模型的推出可以有效推動(dòng)非遺文化的數(shù)字化保護(hù),助力傳統(tǒng)故事、技藝、習(xí)俗等內(nèi)容的數(shù)字化、知識(shí)化、系統(tǒng)化,從而建立非遺的長(zhǎng)效保護(hù)體系,確保非遺文化的可持續(xù)發(fā)展。

在非物質(zhì)文化遺產(chǎn)領(lǐng)域,數(shù)據(jù)的獨(dú)特性與復(fù)雜性成為領(lǐng)域化大模型構(gòu)建的關(guān)鍵挑戰(zhàn)。為確保非遺大模型能夠精準(zhǔn)理解和運(yùn)用文化遺產(chǎn)領(lǐng)域的獨(dú)特知識(shí),研究團(tuán)隊(duì)在數(shù)據(jù)收集階段深入中國非物質(zhì)文化遺產(chǎn)網(wǎng),從機(jī)構(gòu)、政策、資源、咨詢、學(xué)術(shù)五大板塊獲取并整理了海量數(shù)據(jù),涵蓋了政策通知、新聞專題、學(xué)術(shù)建設(shè)及項(xiàng)目介紹等多維度信息。

此外,團(tuán)隊(duì)還充分利用了學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫中的大量非遺相關(guān)期刊論文摘要,最終通過對(duì)網(wǎng)頁內(nèi)容的分類解析和期刊論文摘要的整理,構(gòu)建了一個(gè)內(nèi)容豐富、體量龐大的非遺領(lǐng)域預(yù)訓(xùn)練數(shù)據(jù)集。

預(yù)訓(xùn)練數(shù)據(jù)集的構(gòu)建是非遺大語言模型獲取領(lǐng)域知識(shí)的必要條件,目前的通用領(lǐng)域大模型雖然在語言能力與通用知識(shí)上表現(xiàn)出色,但缺乏對(duì)特定領(lǐng)域知識(shí)的了解,通過在批量領(lǐng)域化數(shù)據(jù)上開展預(yù)訓(xùn)練,能夠彌補(bǔ)通用大模型在非遺領(lǐng)域知識(shí)上的匱乏。

為使模型能夠更好地理解和響應(yīng)非遺相關(guān)的問題,研究團(tuán)隊(duì)結(jié)合前期獲取的非遺領(lǐng)域數(shù)據(jù),通過對(duì)數(shù)據(jù)的量化統(tǒng)計(jì)和領(lǐng)域?qū)<业姆治?,?gòu)建了面向非遺領(lǐng)域的知識(shí)實(shí)體標(biāo)注方案。在此基礎(chǔ)上,經(jīng)過長(zhǎng)期的人工數(shù)據(jù)標(biāo)注與校驗(yàn),實(shí)現(xiàn)了非遺數(shù)據(jù)知識(shí)實(shí)體的精細(xì)標(biāo)注,為后續(xù)模型的進(jìn)一步訓(xùn)練提供了高質(zhì)量數(shù)據(jù)基礎(chǔ)。

為了進(jìn)一步豐富訓(xùn)練數(shù)據(jù),研究團(tuán)隊(duì)結(jié)合大語言模型時(shí)代下數(shù)據(jù)生成的特性,與南京大學(xué)“術(shù)語與翻譯跨學(xué)科研究”基地的魏向清教授團(tuán)隊(duì)進(jìn)行合作,融合《中國世界級(jí)非遺文化悅讀系列》叢書中蘊(yùn)含的豐富知識(shí),依托超大型語言模型,對(duì)已有非遺文本數(shù)據(jù)進(jìn)行了轉(zhuǎn)換與增強(qiáng),構(gòu)建了高質(zhì)量的領(lǐng)域知識(shí)對(duì)話數(shù)據(jù)。領(lǐng)域知識(shí)對(duì)話數(shù)據(jù)的構(gòu)建,是大語言模型為非遺領(lǐng)域研究與學(xué)習(xí)人員提供基礎(chǔ)服務(wù)的需求,對(duì)話大模型能夠更好地服務(wù)于非遺文化傳播與研究。

依托南京農(nóng)業(yè)大學(xué)高性能算力平臺(tái),研究團(tuán)隊(duì)在現(xiàn)有高性能大語言模型的基礎(chǔ)上訓(xùn)練了非遺領(lǐng)域基座大模型,并進(jìn)一步構(gòu)建了非遺對(duì)話大模型。基座大模型的推出為大模型技術(shù)在非遺領(lǐng)域的深入應(yīng)用奠定了基礎(chǔ),后續(xù),結(jié)合非遺領(lǐng)域特色,有望實(shí)現(xiàn)更多領(lǐng)域內(nèi)的特定任務(wù),推動(dòng)大語言模型技術(shù)在非遺領(lǐng)域的深入發(fā)展。對(duì)話大模型讓更多非遺知識(shí)的研究和學(xué)習(xí)者能夠更加便捷地獲取非遺相關(guān)知識(shí),在非遺文化推廣與挖掘方面提供智能技術(shù)支持。

在非遺傳播過程中,非遺對(duì)話大模型可以實(shí)現(xiàn)非遺文化的自動(dòng)化傳播與知識(shí)普及,并通過其強(qiáng)大的跨語言能力,將不同地域的非遺文化融合,打破語言障礙,更有助于非遺文化走向國際,為中華民族文化自信道路建設(shè)貢獻(xiàn)力量。

在輔助非遺傳承方面,非遺大模型能夠?yàn)榉沁z傳承人提供更加便捷的技術(shù)支持,使非遺傳承人能夠更好地利用新技術(shù)實(shí)現(xiàn)非遺文化的創(chuàng)造性轉(zhuǎn)化。

同時(shí),借助大語言模型在非遺基礎(chǔ)上進(jìn)行文化再創(chuàng)造,深入挖掘非遺文化中蘊(yùn)含的精神財(cái)富,結(jié)合知識(shí)圖譜技術(shù)對(duì)非遺文化進(jìn)行知識(shí)化存儲(chǔ),有助于研究人員更系統(tǒng)地研究非遺文化的內(nèi)在邏輯和傳承脈絡(luò)。

非遺大模型的推出,為非物質(zhì)文化遺產(chǎn)的數(shù)字化保護(hù)提供了強(qiáng)有力的技術(shù)支撐,在此背景下,傳統(tǒng)文化與新質(zhì)生產(chǎn)力的結(jié)合將為傳統(tǒng)文化的活化傳承與創(chuàng)新發(fā)展開辟新的途徑。未來,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的持續(xù)拓展,我們有理由相信,非遺文化將在數(shù)字化浪潮中煥發(fā)出更加璀璨的光彩。

原文鏈接:

http://www.jskjb.com:8081/xpaper/news/133494/146190/163003-1.shtml


編輯:俞佳寧

閱讀次數(shù):1

(0)
返回原圖
/