- +1
數(shù)說兩會|1978年到2024年政府工作報告關鍵詞盤點
2024年3月5日上午,十四屆全國人大二次會議在人民大會堂舉行開幕會。國務院總理李強代表國務院,向十四屆全國人大二次會議作政府工作報告。
澎湃新聞從中國政府網(wǎng)上,整理了1978年至2024年共計47份《政府工作報告》,通過文本挖掘算法,一同解鎖中國發(fā)展背后的政策密碼。
一份政府工作報告一般分為兩個部分:對過去的回顧總結、對未來工作的發(fā)展部署。
47年間,政府對未來的發(fā)展布局有何變化?澎湃新聞分析了在發(fā)展部署部分,關鍵詞共現(xiàn)詞的變化情況。

不難發(fā)現(xiàn),近些年,一些新的共現(xiàn)詞頻繁出現(xiàn):1978年至2017年的政府工作報告,和“發(fā)展”共同高頻相鄰出現(xiàn)的,是“經(jīng)濟”“社會”。然而,從2018年政府工作報告開始,“高質量”成為了“發(fā)展”最大的關鍵詞。
不僅如此,“建設”的共現(xiàn)詞,從早些年的“現(xiàn)代化建設”“經(jīng)濟建設”,發(fā)展到進入21世紀的“基礎設施建設”,再到如今的“政府建設”。2024年政府工作報告提出,“全面加強政府建設,大力提升治理效能”。
澎湃新聞也統(tǒng)計了47份《政府工作報告》中的常青詞匯。結果顯示,“發(fā)展”、“建設”以及“經(jīng)濟”等詞語在過去47年中一直高頻出現(xiàn)。

還有部分詞語愈發(fā)頻繁地出現(xiàn)在《政府工作報告》中,例如“政策”“保障”。因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”。近些年新的喇叭形詞語,還包括“高質量”“數(shù)字”“人工智能”。

那么,2024年的政府工作報告有哪些新詞匯?澎湃新聞找到了一些今年提到,但過去五年(2019年-2023年)未曾提及的詞語,例如“基礎教育”“市場秩序”“質量第一”。
分析方法:1.本文所有原始文本材料來自中國政府網(wǎng)1978年至2024年政府工作報告。
2.本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數(shù)字、單字、標點符號。
3.為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網(wǎng)和新華網(wǎng)統(tǒng)計的兩會熱詞。
4.在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。本文使用的語料庫即1978年至2024年政府工作報告文本。
澎湃新聞記者 舒怡爾 對文本有所貢獻





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




