用AI寫論文？從“回避”到“擁抱”，歷史學者要辦一場比賽

澎湃訊

2026-03-30 12:11

來源：澎湃新聞

聽全文

2026年3月30日，一項面向高校本科生的歷史學術(shù)競賽正式啟動。與常規(guī)歷史學論文比賽不同，這場名為“我用AI寫歷史”的學術(shù)論文競賽，明確要求“使用指定的大語言模型（LLM）完成歷史學論文寫作，并提交全過程材料”，鼓勵參賽者“充分地、大膽地使用人工智能進行歷史論文寫作”。

這項比賽由南京大學數(shù)字史學研究中心主辦，清華大學日新書院、中國社會科學院大學數(shù)字史學研究中心、復旦大學歷史學系、上海交通大學人文學院歷史數(shù)據(jù)中心、浙江大學歷史學院數(shù)智史學交叉實驗室、陜西師范大學歷史文化學院等多家單位協(xié)辦，試圖在高校和期刊對AI使用普遍持謹慎態(tài)度的背景下，走出一條不同的道路。

“在‘平行宇宙’中暴露問題”

賽事的組織者、南京大學歷史學院教授王濤告訴澎湃新聞（www.school126.cn）：“我們有一個預設(shè)，希望學術(shù)界注意到，在人工智能迅速發(fā)展的當下，傳統(tǒng)的學術(shù)成果展現(xiàn)方式，包括學術(shù)論文發(fā)表，已經(jīng)不是一個特別要緊的事情。我們發(fā)起一個‘鼓勵充分使用’人工智能的寫作競賽，企圖展現(xiàn)一個學術(shù)研究的‘平行宇宙’，讓問題充分暴露，從而讓學界同行意識到真的已經(jīng)到了需要提出應(yīng)對方案的地步?！?/p>

競賽的征稿啟示這樣解釋這場比賽的緣起：“人工智能浪潮正迅速沖擊歷史學的研究、寫作與發(fā)表。與此同時，不少高校與學術(shù)期刊陸續(xù)發(fā)布AI使用守則，使得AI在學術(shù)實踐中常被‘低調(diào)處理’‘隱形使用’，從而造成研究過程不可追溯、方法不可討論、倫理難以更新。”王濤認為，目前主流學術(shù)期刊的AI使用規(guī)范，其實是對作者良心的考量：“完全有可能出現(xiàn)這種情況：作者充分使用了AI，但是機器檢測不出來，人類評審專家也看不出來。而作者就是不承認用了AI。那么，這樣的規(guī)范就是遮羞布。我們不需要反思為什么AI使用規(guī)范不能被遵守，而應(yīng)該反思為什么作者會對使用AI的真實情況撒謊。是作者羞于提及AI，還是覺得無所謂，還是其他原因？我們希望通過競賽，創(chuàng)造一種作者不以使用AI為恥的環(huán)境，然后再去考慮哪些規(guī)范已經(jīng)落后了?！?/p>

本次競賽設(shè)定三大目標：探索人機協(xié)作的邊界，評估AI的可能性與局限性，推動方法與倫理更新。主辦方認為，與其回避，不如擁抱；與其限制，不如探索。在明確規(guī)則與公開披露的前提下，讓人工智能從“隱形使用者”走向“臺前協(xié)作者”，使其參與過程變得可追溯、可討論、可評估。

王濤表示，目前大家在談?wù)撊斯ぶ悄艿馁x能或者局限性的時候，往往缺乏具體的案例，競賽則可以提供活生生的案例，既可以引起大家對人機協(xié)同歷史書寫的具體問題的討論，比如界定“輔助”和“代寫”，署名權(quán)的問題，也可以引申出學術(shù)研究的意義這樣的宏大議題，這就是征稿啟示中強調(diào)的“以實踐反推倫理”。

“我們在教學中，已經(jīng)遇到了學生用人工智能提交作業(yè)，甚至讓人工智能撰寫會議論文并被會議收錄的情況。學生們已經(jīng)在大膽使用人工智能了，我們卻還在用傳統(tǒng)的眼光看待他們?！蓖鯘f。本次比賽的參賽對象限定為大二至大四年級的中國境內(nèi)外高校在讀本科生?！拔覀兿Ｍ麣v史專業(yè)的學生掌握一些基本的學術(shù)能力以后再來參加比賽，因此規(guī)定大二以上可以參賽?！迸c此同時，比賽也鼓勵考古學、文博、區(qū)域國別、哲學、政治學等相關(guān)專業(yè)學生參與，但明確要求論文需符合歷史學基本訓練與規(guī)范。

三條賽道和兩場專題培訓

比賽由南京大學數(shù)智文獻實驗室提供內(nèi)容支持，參賽選手報名后自動注冊為南京大學數(shù)智文獻處理平臺用戶，可在三種方式中任選其一進行創(chuàng)作，也可綜合運用。第一種方式為指定文獻命題創(chuàng)作，即在主辦方統(tǒng)一指定的文獻范圍內(nèi)，利用數(shù)智文獻處理平臺進行史料長編整理、智能分析，最終形成一篇完整的學術(shù)論文。第二種為自選文獻自由創(chuàng)作，選手可自行上傳個人收藏或公開獲取的歷史文獻至平臺，借助平臺的分析工具進行研究。第三種是多工具融合創(chuàng)作，在利用平臺完成文本處理的基礎(chǔ)上，結(jié)合其他AI工具如地理信息系統(tǒng)GIS等進行跨維度分析，形成具有多學科特色的論文。寫作周期為期20天。

為使參賽選手熟悉平臺操作及大模型應(yīng)用，主辦方將在賽前組織兩場專題培訓，分別是大語言模型API應(yīng)用培訓和平臺操作培訓。前者內(nèi)容涵蓋基本原理、API調(diào)用方法、提示詞設(shè)計技巧以及在歷史寫作中的典型應(yīng)用案例，后者重點培訓文獻識別、翻譯、語義檢索、史料長編自動生成等核心功能。

競賽對透明披露的要求體現(xiàn)在多個層面。在模型使用方面，比賽默認調(diào)用指定模型。如選手在創(chuàng)作過程中自行使用其他大語言模型進行輔助，須在提交作品時附上詳細說明，包括所使用模型的名稱、版本、使用方式及具體用途。在過程記錄方面，數(shù)智文獻處理平臺將自動記錄選手在比賽期間的操作軌跡，包括文獻處理、檢索、分析等流程。這些記錄將作為評分的重要參考依據(jù)，使得AI參與歷史寫作的全過程變得可追溯、可復現(xiàn)。

“指定大模型是為了讓工具的差異性可以忽略，只關(guān)注學生個體的能力素養(yǎng)。同時，我們也限定在數(shù)智文獻平臺上進行，主要是為了讓學生們認識到，對歷史文獻的使用之于歷史研究的重要性?！蓖鯘f。

人機協(xié)同的評審與倫理

本次比賽的評審機制采用“人機協(xié)同”的模式，由AI評分與專家評分共同決定最終成績。

AI打分時，首先制定多維評分標準，包括史料運用的準確性、邏輯結(jié)構(gòu)的嚴謹性、分析深度、創(chuàng)新性等。由大語言模型對參賽作品進行多次獨立打分，去掉最高分與最低分后，取剩余分數(shù)的平均值作為該模型的評分。隨后選用多個不同的大語言模型分別執(zhí)行上述操作，得到各模型的評分，再將這些模型的評分去掉最高分與最低分后取平均，得到最終的AI評分。

人類專家評審則邀請歷史學領(lǐng)域的專家學者組成評審委員會，從學術(shù)價值、問題意識、論證過程等角度進行專業(yè)評審。綜合成績由AI評分與專家評分按一定權(quán)重加權(quán)計算得出。

在學術(shù)倫理方面，征稿啟事中的責任聲明指出：本競賽鼓勵充分使用AI，但要求全過程透明披露。參賽作者對論文內(nèi)容承擔全部學術(shù)責任，包括事實準確性、引用規(guī)范與觀點表達。嚴禁偽造史料、捏造引文或虛構(gòu)參考文獻，一經(jīng)發(fā)現(xiàn)取消資格。同時，組委會鼓勵參賽者把“AI可能出錯”作為研究對象之一，記錄錯誤、解釋原因、提出應(yīng)對策略。

競賽鼓勵“充分使用”，但是否存在“上限”？假設(shè)一篇論文的80%由AI生成，學生僅做修改和整合，這樣的作品是否符合競賽精神？王濤表示，比賽中不做限制?！耙环矫鎸嶋H操作中很難用百分比來設(shè)置上限，另一方面我們是希望讓學生意識到，寫作本來是自我表達的手段，如果他認為可以用一個人工智能完成的作品代替自己的思路，或者愿意提交一個不經(jīng)過人工審核的作品代表自己的思考，那就是在放棄自己的主動性。這樣的作品進入競賽環(huán)節(jié)，也許評審無法識別出來，但作者就是在用這樣的行為創(chuàng)造一種新的學術(shù)生態(tài)。他們將是未來學術(shù)生態(tài)的創(chuàng)立者，他們的態(tài)度將是未來學術(shù)倫理的內(nèi)核，他們愿意在什么樣的環(huán)境下思考問題、研究歷史，這種不加限制的人工智能使用場景就是具體行為的開始?！?/p>

除一二三等獎外，比賽還特別設(shè)置“最具爭議獎”頒發(fā)給人類評審與AI評審分差最大的作品?！霸u分的差異很難預測。但我們的目的是讓人類專家也有機會見識‘學術(shù)論文’成果形態(tài)的多樣性?！蓖鯘f。他表示，這場人機協(xié)作的史學實驗，試圖在真實的寫作過程中，重新審視并更新數(shù)字時代的學術(shù)倫理，讓人工智能從“低調(diào)處理”的陰影中走出，在公開透明的框架下接受檢驗、討論與評估，“讓規(guī)范在真實寫作中被檢驗、被修訂，而不是停留在抽象禁令”。