- +1
歷史與AI的距離|初代AI助教上崗記
2025年上半年,本人有幸獲得復(fù)旦大學(xué)教務(wù)處的資助,得以在本科階段通識(shí)課程“16-20世紀(jì)的歐洲殖民帝國(guó)”的教學(xué)中引入AI助教,這位AI助教由某知名數(shù)據(jù)服務(wù)公司提供技術(shù)支持。如今,學(xué)期已進(jìn)入尾聲,我的初代AI助教完成了本學(xué)期的工作任務(wù),在系統(tǒng)里留下了同學(xué)們的訪問(wèn)數(shù)據(jù),幫助我復(fù)盤這項(xiàng)教改實(shí)驗(yàn)。
什么樣的高等教育場(chǎng)景需要一位AI助教?
相較于基礎(chǔ)教育階段,高等教育階段人文類課程的知識(shí)點(diǎn)的結(jié)構(gòu)化和標(biāo)準(zhǔn)化程度較低,考核形式多元,也就很難吸引企業(yè)研發(fā)出商業(yè)化產(chǎn)品。而在人文學(xué)科所教授的諸多內(nèi)容中,有關(guān)學(xué)術(shù)論文寫作的知識(shí)點(diǎn)結(jié)構(gòu)化和標(biāo)準(zhǔn)化程度較高,市面上已有許多專門針對(duì)這一內(nèi)容的高質(zhì)量作品。因此,從可行性來(lái)看,將這些出版物的內(nèi)容根據(jù)自身需求進(jìn)行結(jié)構(gòu)化處理后,就可以用于訓(xùn)練服務(wù)特定課程需要的、幫助學(xué)生提高論文寫作水平的智能體。

圖1-3:撰寫學(xué)術(shù)論文的參考書
從技術(shù)條件來(lái)看,近幾年不少為高校提供在線教育平臺(tái)的企業(yè)都已經(jīng)將大語(yǔ)言模型融入產(chǎn)品中,如推出AI助教功能。對(duì)于理工醫(yī)科的課程來(lái)說(shuō),AI助教可以提供答疑、出題、復(fù)習(xí)等服務(wù),幫助學(xué)生鞏固知識(shí)點(diǎn)。對(duì)人文類的教師來(lái)說(shuō),同樣可以利用AI助教提供針對(duì)學(xué)術(shù)論文寫作的專項(xiàng)服務(wù)。
從現(xiàn)實(shí)需求來(lái)看,盡管不同學(xué)科都在許多領(lǐng)域投入人力和資源幫助學(xué)生提高學(xué)術(shù)論文寫作水平,但學(xué)生提交的論文的質(zhì)量依然不夠理想。為了幫助學(xué)生提高通識(shí)課論文的寫作能力,有些學(xué)校會(huì)提供寫作指導(dǎo),有些老師會(huì)讓學(xué)生在期中提交一份寫作計(jì)劃隨后進(jìn)行指導(dǎo)。前者因?yàn)榉?wù)能力的限制和學(xué)生學(xué)習(xí)時(shí)間的限制,能覆蓋到的群體規(guī)模有限。后者受班級(jí)規(guī)模限制,而通識(shí)課一般選課人數(shù)較多,因此人均可以獲得的指導(dǎo)時(shí)間也相對(duì)較少。
如何提高非人文社科專業(yè)的學(xué)生提交的文科通識(shí)課論文水平,對(duì)任課教師來(lái)說(shuō)是一個(gè)必須直面的難點(diǎn)。不可否認(rèn),在我評(píng)閱通識(shí)課的學(xué)生論文時(shí),有不少高水平的論文是由非人文社科專業(yè)的學(xué)生完成的。但此類學(xué)生中仍有相當(dāng)一部分提交的論文像是在用數(shù)千字回答一道極為宏大的高考?xì)v史問(wèn)答題。
近年來(lái),選修我講授的通識(shí)課的學(xué)生來(lái)源發(fā)生了顯著的變化,人文社科類學(xué)生的占比從超過(guò)70%降低到了40%,使得幫助非人文社科專業(yè)的學(xué)生提高論文寫作水平的需求更為迫切。綜合上述考慮,對(duì)于人文類通識(shí)課來(lái)說(shuō),需要為學(xué)生在學(xué)期內(nèi)提供個(gè)性化指導(dǎo),以提高他們撰寫人文類論文的能力,且指導(dǎo)的內(nèi)容僅限于規(guī)則講授、初步評(píng)價(jià)、資料推薦,不包括為學(xué)生直接提供論文選題或生成研究?jī)?nèi)容。這既能解決一個(gè)長(zhǎng)期以來(lái)被忽視的學(xué)業(yè)轉(zhuǎn)段后的學(xué)習(xí)難點(diǎn),也能限制性利用新的技術(shù)手段。指導(dǎo)的目標(biāo)是為了提高論文的下限,幫助學(xué)生,使用符合規(guī)范的表達(dá)形式,并將更多的時(shí)間用于尋找研究問(wèn)題。這便是我為AI助教設(shè)置的工作目標(biāo)和工作場(chǎng)景。
崗前培訓(xùn):這位助教該學(xué)點(diǎn)什么?
訓(xùn)練AI智能體的常用手段是提供系統(tǒng)提示詞、高質(zhì)量知識(shí)庫(kù)和問(wèn)答對(duì)。三者共同的目標(biāo)是減少通用大語(yǔ)言模型生成時(shí)出現(xiàn)幻覺,提供更可靠、更有針對(duì)性的答案。系統(tǒng)提示詞即是智能體工作的準(zhǔn)則,可以提供的文本總量較少,形式上則要便于AI訪問(wèn)和使用。其中需要解釋AI助教的工作目標(biāo)、主要技能和運(yùn)行中的限制。目標(biāo)和技能都包括三個(gè)方面,即梳理課程內(nèi)容、確定論文選題和提高寫作質(zhì)量。具體而言,涉及到智能體應(yīng)優(yōu)先訪問(wèn)哪些資料,哪些選題符合課程要求并更具有可操作性,以及寫作中的注意事項(xiàng)。至于AI助教的行為限制,則包括該智能體只能提供建議,不能代為生成文稿,以及面對(duì)現(xiàn)有知識(shí)庫(kù)不能覆蓋的問(wèn)題時(shí),智能體應(yīng)如何解決。

圖4:訓(xùn)練AI助教的步驟和主要內(nèi)容
知識(shí)庫(kù)中的資料和智能體的目標(biāo)與技能相互呼應(yīng),包括三個(gè)部分。第一部分是課程最主要的知識(shí)點(diǎn)整理和主要參考文獻(xiàn),第二部分是論文寫作指導(dǎo),第三部分是學(xué)術(shù)規(guī)范和AI使用規(guī)范。準(zhǔn)備第一部分內(nèi)容的難度最高,原因是要將現(xiàn)有的教學(xué)詳案重新梳理,根據(jù)時(shí)間、空間和主題歸納知識(shí)點(diǎn),再以便于機(jī)器使用的形式來(lái)呈現(xiàn)。由于這門課的知識(shí)點(diǎn)并不是學(xué)生需要通過(guò)AI助教學(xué)習(xí)的內(nèi)容,只是作為幫助學(xué)生選題的背景知識(shí),因此覆蓋的范圍越大越好,而非結(jié)構(gòu)化程度越高越好。直接為知識(shí)庫(kù)提供文稿比向?qū)W生提供知識(shí)圖譜更能匹配這個(gè)智能體的任務(wù)。
第二部分的內(nèi)容根據(jù)學(xué)生寫作論文的流程展開,包括可用于查找文獻(xiàn)的數(shù)據(jù)庫(kù)信息、選題原則與不同選題的側(cè)重和難度、如何實(shí)踐歷史學(xué)的研究方法、運(yùn)用其他學(xué)科方法的原則和論文自查的要點(diǎn)。其中的數(shù)據(jù)庫(kù)信息與學(xué)校圖書館提供的電子資源庫(kù)匹配,引導(dǎo)學(xué)生從可以獲得的資源中找到合適的資料。對(duì)于選題的建議則基于課程主題、不同時(shí)段的主要研究問(wèn)題和不同研究問(wèn)題的難度等。這些建議源自以往評(píng)閱中發(fā)現(xiàn)的問(wèn)題,包括論文選題和課程主題在時(shí)空范圍上不匹配,或者是用當(dāng)代概念去分析更早時(shí)段的現(xiàn)象,又或是學(xué)生自以為是“歷史研究”的問(wèn)題,實(shí)則只是現(xiàn)象描述。不適當(dāng)?shù)倪x題背后,折射的是學(xué)生對(duì)時(shí)空觀念、概念工具、史學(xué)論點(diǎn)構(gòu)建等史學(xué)研究的基礎(chǔ)知識(shí)未很好掌握。因此,調(diào)整選題的過(guò)程,其實(shí)是增進(jìn)學(xué)生對(duì)“什么是歷史研究”的認(rèn)識(shí)的過(guò)程。
與研究方法和論文自查要點(diǎn)有關(guān)的內(nèi)容包括論文必要的組成部分、每個(gè)部分適當(dāng)?shù)拈L(zhǎng)度、關(guān)鍵部分的內(nèi)容構(gòu)成等等。自查要點(diǎn)與課程的評(píng)分標(biāo)準(zhǔn)對(duì)齊,與第三部分的規(guī)范性文件呼應(yīng)。我設(shè)置的論文評(píng)分標(biāo)準(zhǔn)包括四大類17個(gè)子項(xiàng)和往年失分點(diǎn)分析,其中有大量涉及對(duì)論文的形式要求,而非內(nèi)容要求。此舉不僅是為了便于AI助教開展有針對(duì)性的評(píng)價(jià),也是因?yàn)樾问揭蠹确€(wěn)定,同時(shí)能提高論文的學(xué)術(shù)性。
這里所說(shuō)的“學(xué)術(shù)性”不僅是為了讓論文排版上“看起來(lái)像”論文,而是因?yàn)樽駨男问揭蟮倪^(guò)程中,不擅長(zhǎng)史學(xué)論文寫作的學(xué)生能慢慢將“廣而全”的史實(shí)羅列向“專而精”的學(xué)術(shù)研究推進(jìn)。例如,學(xué)生在詢問(wèn)課程論文要求時(shí),會(huì)發(fā)現(xiàn)需要討論研究前史,即“文獻(xiàn)回顧”。學(xué)生要得到這部分分?jǐn)?shù),就需要明白這項(xiàng)工作的重點(diǎn)和目的。AI助教可以從知識(shí)庫(kù)中訪問(wèn)到相關(guān)內(nèi)容,并引導(dǎo)學(xué)生在寫作文獻(xiàn)回顧的過(guò)程中,尋找有新意的研究問(wèn)題,還可以為學(xué)生提供初步的質(zhì)量評(píng)價(jià)。

圖5:逐步獲得有關(guān)“文獻(xiàn)回顧”的信息、要求、步驟和質(zhì)量評(píng)價(jià)的示例問(wèn)答
第三部分的規(guī)范包含兩份文件,一份是復(fù)旦大學(xué)通識(shí)教育中心提供的格式與引用規(guī)則,另一份是復(fù)旦大學(xué)公布的AI使用規(guī)則。未能被這兩份規(guī)則包括的少量要求是在課堂上提供的,也在可供學(xué)生下載的課件中進(jìn)行了說(shuō)明。此舉是為了通過(guò)論文中的細(xì)節(jié)表現(xiàn)來(lái)了解學(xué)生課堂學(xué)習(xí)的效果,讓期末成績(jī)能更好地反映學(xué)生學(xué)習(xí)的整體情況。
在系統(tǒng)提示詞注入和知識(shí)庫(kù)搭建完成后,我與AI助教進(jìn)行了幾輪對(duì)話,提出了幾個(gè)比較基本的問(wèn)題。AI助教給出的答案基本符合我的預(yù)期,能優(yōu)先訪問(wèn)相關(guān)性更高的高質(zhì)量資料。由于此前從未使用過(guò)AI助教,我選擇通過(guò)初代AI助教來(lái)收集學(xué)生的問(wèn)題,在訓(xùn)練二代AI助教時(shí)提供更有針對(duì)性的問(wèn)答對(duì)。
工作實(shí)測(cè):這位助教解答了哪些問(wèn)題?
從2025年9月上線,到12月提交論文,選課學(xué)生中有超過(guò)75%訪問(wèn)了AI助教,約60%向AI助教提出了問(wèn)題。在所有提出問(wèn)題的學(xué)生中,約有40%進(jìn)行了10輪及以上的對(duì)話。從訪問(wèn)時(shí)間來(lái)看,出現(xiàn)過(guò)兩個(gè)高峰。第一個(gè)高峰在10月,命中提問(wèn)的信息主要來(lái)自大模型本身。第二個(gè)高峰在12月,命中問(wèn)題的信息主要來(lái)自知識(shí)庫(kù)。

圖6:訪問(wèn)時(shí)間和命中量
如果對(duì)學(xué)生提問(wèn)的內(nèi)容和機(jī)器的回答進(jìn)行更為細(xì)致的分析,既能發(fā)現(xiàn)他們感興趣的問(wèn)題,也能觀察他們提問(wèn)的方式,以及智能體是否可以準(zhǔn)確地理解學(xué)生的意圖,并以符合我預(yù)期的方式來(lái)回答。下圖按照論文寫作的工作流程排定先后展現(xiàn)學(xué)生提出不同類型的問(wèn)題的比例。我對(duì)“訪問(wèn)知識(shí)庫(kù)”的界定比AI助教平臺(tái)定義的“知識(shí)庫(kù)命中”顯然要寬泛一點(diǎn),包含了系統(tǒng)提示詞發(fā)揮約束作用的情況。

圖7:學(xué)生提問(wèn)分類匯總表
從學(xué)生的需求來(lái)看,他們最希望利用AI助教幫助尋找文獻(xiàn)資料,或是為某個(gè)主題提供推薦讀物,或是為自己看到的文獻(xiàn)提供出處。AI助教在回答這部分問(wèn)題時(shí)主要利用大模型預(yù)訓(xùn)練信息,較少訪問(wèn)知識(shí)庫(kù)中的信息。有學(xué)生使用后反饋稱,雖然這個(gè)智能體虛構(gòu)文獻(xiàn)的情況不能算十分嚴(yán)重,但并未完全避免虛構(gòu)的情況出現(xiàn)。
學(xué)生的第二大需求是希望AI助教生成內(nèi)容,包括名詞解釋、概括上傳的文件內(nèi)容、翻譯英語(yǔ)文獻(xiàn)等。智能體在完成此項(xiàng)工作時(shí)一般會(huì)調(diào)用知識(shí)庫(kù)的內(nèi)容協(xié)助回答,只有在學(xué)生明確提出要求分析上傳文件時(shí),才不會(huì)被系統(tǒng)提示詞或知識(shí)庫(kù)約束。
與第二大需求接近的是提供評(píng)價(jià),其中一半是讓AI助教評(píng)價(jià)論文選題是否符合課程要求,另一半是希望評(píng)價(jià)自己寫的論文是否符合要求。多數(shù)情況下,AI助教能通過(guò)訪問(wèn)論文寫作要求來(lái)進(jìn)行有針對(duì)性地評(píng)價(jià),但偶爾會(huì)直接用大模型預(yù)訓(xùn)練的結(jié)果提出建議,讓引導(dǎo)變成了誤導(dǎo)。
需求占比排在第四位的是和選題有關(guān)的問(wèn)題,包括課程對(duì)選題的要求、對(duì)選題的建議,還有對(duì)選題的評(píng)價(jià)。這部分中和評(píng)價(jià)有關(guān)的數(shù)據(jù)是和“提供評(píng)價(jià)”這類需求中的數(shù)據(jù)重合的。從占比來(lái)看,多數(shù)學(xué)生是在有選題意向后希望AI助教能確認(rèn)是否符合課程要求,較少學(xué)生會(huì)先提出讓AI助教陳述要求,隨后自行參照。這種做法也和與寫作建議有關(guān)的問(wèn)題甚少被提到相呼應(yīng)。學(xué)生在提問(wèn)時(shí)很少讓AI助教直接輸出知識(shí)庫(kù)的信息,尤其是和學(xué)術(shù)規(guī)范有關(guān)的信息。在評(píng)閱論文時(shí),沒有準(zhǔn)確掌握學(xué)術(shù)規(guī)范的論文比例和往年基本相當(dāng),可見即便有了互動(dòng)式學(xué)習(xí)工具,學(xué)生依然缺乏主動(dòng)詢問(wèn)學(xué)術(shù)規(guī)范的意識(shí)。
面對(duì)學(xué)生提出的所有問(wèn)題,AI助教遵循系統(tǒng)提示詞中設(shè)定的原則,拒絕回答的占10%左右,主要是學(xué)生讓AI助教提供論文選題或者生成某些內(nèi)容。有幾位經(jīng)過(guò)了與AI助教的多輪問(wèn)答后,并不信任AI助教的答案,便與老師聯(lián)系以獲得確認(rèn)。這種質(zhì)疑智能體生成內(nèi)容的做法獲得了我的肯定。雖然AI助教給出的答案符合我的設(shè)定,但對(duì)現(xiàn)階段智能體輸出的結(jié)果保持警惕依然是必要的。
反思:如何讓AI助教更好地發(fā)揮作用?
在與AI助教進(jìn)行了多輪問(wèn)答的學(xué)生中,專業(yè)背景并不是影響他們提問(wèn)質(zhì)量與效果的決定性因素。學(xué)生向智能體提問(wèn)的方式、對(duì)于研究問(wèn)題本身和對(duì)論文評(píng)價(jià)要點(diǎn)的熟悉程度影響了他們是否能從AI助教這里獲得更高質(zhì)量的答案。所以,如果要讓學(xué)生從AI助教這里獲得更多可靠且有效的答案,除了提供匹配他們需求的高質(zhì)量問(wèn)答對(duì)作為示例,也要幫助他們提高提問(wèn)的能力。
要提高這種能力意味著提供三方面的補(bǔ)充知識(shí)。一是如何使用結(jié)構(gòu)化的提問(wèn)形式和提示詞幫助AI解碼問(wèn)題,從而更明確地表達(dá)需求。二是了解撰寫論文每一個(gè)階段要解決的問(wèn)題是什么,以及通常是以何種方式獲得這些問(wèn)題的答案。三是理解什么是“研究性問(wèn)題”。如果學(xué)生能理解文科學(xué)術(shù)論文和高考?xì)v史問(wèn)答題之間的巨大差別,也就不會(huì)把AI生成的描述性的史實(shí)羅列變成論文的一部分,將更多的精力投入到提出研究問(wèn)題并探求答案之上。這些知識(shí)可以通過(guò)AI助教來(lái)提供,可以在課堂上講授,也可以作為補(bǔ)充閱讀材料。讓學(xué)生提問(wèn)的能力匹配目前智能體回答問(wèn)題的能力,仍是這一階段利用人工智能教學(xué)工具的重要前提。
在常規(guī)教學(xué)內(nèi)容方面,面對(duì)尚未完全適應(yīng)通過(guò)與智能體互動(dòng)的方式來(lái)學(xué)習(xí)的學(xué)生,依然需要為他們提供常規(guī)的學(xué)習(xí)材料。雖然此次依然為學(xué)生提供了這部分材料,但仍有許多學(xué)生忽視了這部分內(nèi)容。對(duì)于在傳統(tǒng)課堂中成長(zhǎng)起來(lái)的學(xué)生而言,傳統(tǒng)的教學(xué)方法和內(nèi)容仍有長(zhǎng)期保留的必要性。
(聲明:已在課堂上告知選課學(xué)生,他們與AI助教互動(dòng)的數(shù)據(jù)將被用作公開發(fā)表的文章素材,并承諾不會(huì)公開具體的問(wèn)答內(nèi)容,故本文不展示問(wèn)答實(shí)例。)





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




