- +1
用AI寫論文?從“回避”到“擁抱”,歷史學者要辦一場比賽
2026年3月30日,一項面向高校本科生的歷史學術(shù)競賽正式啟動。與常規(guī)歷史學論文比賽不同,這場名為“我用AI寫歷史”的學術(shù)論文競賽,明確要求“使用指定的大語言模型(LLM)完成歷史學論文寫作,并提交全過程材料”,鼓勵參賽者“充分地、大膽地使用人工智能進行歷史論文寫作”。
這項比賽由南京大學數(shù)字史學研究中心主辦,清華大學日新書院、中國社會科學院大學數(shù)字史學研究中心、復旦大學歷史學系、上海交通大學人文學院歷史數(shù)據(jù)中心、浙江大學歷史學院數(shù)智史學交叉實驗室、陜西師范大學歷史文化學院等多家單位協(xié)辦,試圖在高校和期刊對AI使用普遍持謹慎態(tài)度的背景下,走出一條不同的道路。
“在‘平行宇宙’中暴露問題”
賽事的組織者、南京大學歷史學院教授王濤告訴澎湃新聞(www.school126.cn):“我們有一個預設(shè),希望學術(shù)界注意到,在人工智能迅速發(fā)展的當下,傳統(tǒng)的學術(shù)成果展現(xiàn)方式,包括學術(shù)論文發(fā)表,已經(jīng)不是一個特別要緊的事情。我們發(fā)起一個‘鼓勵充分使用’人工智能的寫作競賽,企圖展現(xiàn)一個學術(shù)研究的‘平行宇宙’,讓問題充分暴露,從而讓學界同行意識到真的已經(jīng)到了需要提出應(yīng)對方案的地步?!?/p>
競賽的征稿啟示這樣解釋這場比賽的緣起:“人工智能浪潮正迅速沖擊歷史學的研究、寫作與發(fā)表。與此同時,不少高校與學術(shù)期刊陸續(xù)發(fā)布AI使用守則,使得AI在學術(shù)實踐中常被‘低調(diào)處理’‘隱形使用’,從而造成研究過程不可追溯、方法不可討論、倫理難以更新。”王濤認為,目前主流學術(shù)期刊的AI使用規(guī)范,其實是對作者良心的考量:“完全有可能出現(xiàn)這種情況:作者充分使用了AI,但是機器檢測不出來,人類評審專家也看不出來。而作者就是不承認用了AI。那么,這樣的規(guī)范就是遮羞布。我們不需要反思為什么AI使用規(guī)范不能被遵守,而應(yīng)該反思為什么作者會對使用AI的真實情況撒謊。是作者羞于提及AI,還是覺得無所謂,還是其他原因?我們希望通過競賽,創(chuàng)造一種作者不以使用AI為恥的環(huán)境,然后再去考慮哪些規(guī)范已經(jīng)落后了?!?/p>
本次競賽設(shè)定三大目標:探索人機協(xié)作的邊界,評估AI的可能性與局限性,推動方法與倫理更新。主辦方認為,與其回避,不如擁抱;與其限制,不如探索。在明確規(guī)則與公開披露的前提下,讓人工智能從“隱形使用者”走向“臺前協(xié)作者”,使其參與過程變得可追溯、可討論、可評估。
王濤表示,目前大家在談?wù)撊斯ぶ悄艿馁x能或者局限性的時候,往往缺乏具體的案例,競賽則可以提供活生生的案例,既可以引起大家對人機協(xié)同歷史書寫的具體問題的討論,比如界定“輔助”和“代寫”,署名權(quán)的問題,也可以引申出學術(shù)研究的意義這樣的宏大議題,這就是征稿啟示中強調(diào)的“以實踐反推倫理”。
“我們在教學中,已經(jīng)遇到了學生用人工智能提交作業(yè),甚至讓人工智能撰寫會議論文并被會議收錄的情況。學生們已經(jīng)在大膽使用人工智能了,我們卻還在用傳統(tǒng)的眼光看待他們?!蓖鯘f。本次比賽的參賽對象限定為大二至大四年級的中國境內(nèi)外高校在讀本科生?!拔覀兿M麣v史專業(yè)的學生掌握一些基本的學術(shù)能力以后再來參加比賽,因此規(guī)定大二以上可以參賽?!迸c此同時,比賽也鼓勵考古學、文博、區(qū)域國別、哲學、政治學等相關(guān)專業(yè)學生參與,但明確要求論文需符合歷史學基本訓練與規(guī)范。
三條賽道和兩場專題培訓
比賽由南京大學數(shù)智文獻實驗室提供內(nèi)容支持,參賽選手報名后自動注冊為南京大學數(shù)智文獻處理平臺用戶,可在三種方式中任選其一進行創(chuàng)作,也可綜合運用。第一種方式為指定文獻命題創(chuàng)作,即在主辦方統(tǒng)一指定的文獻范圍內(nèi),利用數(shù)智文獻處理平臺進行史料長編整理、智能分析,最終形成一篇完整的學術(shù)論文。第二種為自選文獻自由創(chuàng)作,選手可自行上傳個人收藏或公開獲取的歷史文獻至平臺,借助平臺的分析工具進行研究。第三種是多工具融合創(chuàng)作,在利用平臺完成文本處理的基礎(chǔ)上,結(jié)合其他AI工具如地理信息系統(tǒng)GIS等進行跨維度分析,形成具有多學科特色的論文。寫作周期為期20天。
為使參賽選手熟悉平臺操作及大模型應(yīng)用,主辦方將在賽前組織兩場專題培訓,分別是大語言模型API應(yīng)用培訓和平臺操作培訓。前者內(nèi)容涵蓋基本原理、API調(diào)用方法、提示詞設(shè)計技巧以及在歷史寫作中的典型應(yīng)用案例,后者重點培訓文獻識別、翻譯、語義檢索、史料長編自動生成等核心功能。
競賽對透明披露的要求體現(xiàn)在多個層面。在模型使用方面,比賽默認調(diào)用指定模型。如選手在創(chuàng)作過程中自行使用其他大語言模型進行輔助,須在提交作品時附上詳細說明,包括所使用模型的名稱、版本、使用方式及具體用途。在過程記錄方面,數(shù)智文獻處理平臺將自動記錄選手在比賽期間的操作軌跡,包括文獻處理、檢索、分析等流程。這些記錄將作為評分的重要參考依據(jù),使得AI參與歷史寫作的全過程變得可追溯、可復現(xiàn)。
“指定大模型是為了讓工具的差異性可以忽略,只關(guān)注學生個體的能力素養(yǎng)。同時,我們也限定在數(shù)智文獻平臺上進行,主要是為了讓學生們認識到,對歷史文獻的使用之于歷史研究的重要性?!蓖鯘f。
人機協(xié)同的評審與倫理
本次比賽的評審機制采用“人機協(xié)同”的模式,由AI評分與專家評分共同決定最終成績。
AI打分時,首先制定多維評分標準,包括史料運用的準確性、邏輯結(jié)構(gòu)的嚴謹性、分析深度、創(chuàng)新性等。由大語言模型對參賽作品進行多次獨立打分,去掉最高分與最低分后,取剩余分數(shù)的平均值作為該模型的評分。隨后選用多個不同的大語言模型分別執(zhí)行上述操作,得到各模型的評分,再將這些模型的評分去掉最高分與最低分后取平均,得到最終的AI評分。
人類專家評審則邀請歷史學領(lǐng)域的專家學者組成評審委員會,從學術(shù)價值、問題意識、論證過程等角度進行專業(yè)評審。綜合成績由AI評分與專家評分按一定權(quán)重加權(quán)計算得出。
在學術(shù)倫理方面,征稿啟事中的責任聲明指出:本競賽鼓勵充分使用AI,但要求全過程透明披露。參賽作者對論文內(nèi)容承擔全部學術(shù)責任,包括事實準確性、引用規(guī)范與觀點表達。嚴禁偽造史料、捏造引文或虛構(gòu)參考文獻,一經(jīng)發(fā)現(xiàn)取消資格。同時,組委會鼓勵參賽者把“AI可能出錯”作為研究對象之一,記錄錯誤、解釋原因、提出應(yīng)對策略。
競賽鼓勵“充分使用”,但是否存在“上限”?假設(shè)一篇論文的80%由AI生成,學生僅做修改和整合,這樣的作品是否符合競賽精神?王濤表示,比賽中不做限制?!耙环矫鎸嶋H操作中很難用百分比來設(shè)置上限,另一方面我們是希望讓學生意識到,寫作本來是自我表達的手段,如果他認為可以用一個人工智能完成的作品代替自己的思路,或者愿意提交一個不經(jīng)過人工審核的作品代表自己的思考,那就是在放棄自己的主動性。這樣的作品進入競賽環(huán)節(jié),也許評審無法識別出來,但作者就是在用這樣的行為創(chuàng)造一種新的學術(shù)生態(tài)。他們將是未來學術(shù)生態(tài)的創(chuàng)立者,他們的態(tài)度將是未來學術(shù)倫理的內(nèi)核,他們愿意在什么樣的環(huán)境下思考問題、研究歷史,這種不加限制的人工智能使用場景就是具體行為的開始?!?/p>
除一二三等獎外,比賽還特別設(shè)置“最具爭議獎”頒發(fā)給人類評審與AI評審分差最大的作品?!霸u分的差異很難預測。但我們的目的是讓人類專家也有機會見識‘學術(shù)論文’成果形態(tài)的多樣性?!蓖鯘f。他表示,這場人機協(xié)作的史學實驗,試圖在真實的寫作過程中,重新審視并更新數(shù)字時代的學術(shù)倫理,讓人工智能從“低調(diào)處理”的陰影中走出,在公開透明的框架下接受檢驗、討論與評估,“讓規(guī)范在真實寫作中被檢驗、被修訂,而不是停留在抽象禁令”。

3月30日由南京大學歷史學院發(fā)布的比賽征稿啟示





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




