基一包養心得于BERTopic主題模子的鋰電池前沿監測及主題剖析研討

作者:

分類:

requestId:687f3adcb5e458.79158331.

作者:周洪1,2(), 俞海龍3, 王麗平4, 黃學杰3()  

單位:1. 中國科學院武漢文獻情報中間;2. 中國科學院年夜學經濟與治理學院信息資源治理系;3. 中國科學院物理研討所;4. 電子科技年夜學資料與動力學院

援用:周洪, 俞海龍, 王麗平, 等. 基于BERTopic主題模子的鋰電池前沿監測及主題剖析研討[J]. 儲能科學與技術, 2025, 14(1): 406-416.

DOI:10.19799/j.cnki.2095-4239.2024.0697

本文亮點:1、運用B她愣了一下。ertopic主題模子,對全球鋰電池科學論文進行包養網文天職析,構建鋰電池研討知識圖譜,提醒新興與熱點主題。2、對比Bertopic剖析結果,探討了科學文獻監測,為未來研討和文獻監測任務供給參考。

摘 要 隨著鋰電池領域論文數量的激增和研討主題的日益豐富,準確監測該領域的發展趨勢和掌握最新研討動向變得日益復雜。通過運用年夜數據和機器學習技術,采用BERTopic主題模子對Web of Science數據庫中的18萬余篇鋰電池論文進行文天職析,繪制了鋰電池領域的主題圖,識別了新興研討主題和高被引主題。結果表白,鋰電池研討活動正顯著加快,鋰硫電池、鋰枝晶生長克制、電池收受接管和金屬收受接管等新興主題疾速發展,而資料研討如二硫化鉬納米資料、氧化鐵電極資料則具有顯著的高學術影響力。研討還探討了《鋰電池百篇論文點評系列》對當前鋰電池研討主題的監測情況,該系列對多數科學技術主題有傑出覆蓋。本研討為鋰電池領域的主題監測供給了新方式,為政策制訂和技術研發供給了情報支撐,并為“鋰電池百篇論文點評”系列的后續研討供給了參考。

關鍵詞 鋰電池;BERTopic;新興主題;高被引主題;前沿監測

科學文獻作為知識積累的寶貴資源,對推動科技進步、產業發展甚至整個社會的發展具有主要感化。若何有用地從這些文獻中提煉出有價值的知識和見解,進而為科研任務者和產業界服務,已成為廣泛關注的議題。一種有用的戰略是按期檢索和剖析論文數據庫中的新文獻,以捕獲科學前沿的最新動態和趨勢。《儲能科學與技術》期刊自2012年10月起發布的“鋰電池百篇論文點評”系列文章,是采用此戰略的一個典範實踐。該系列每兩月精選并評述100篇與鋰電池相關的最新論文,跟蹤鋰電池領域的最新研討進展,覆蓋了正極資料、負極資料、電解質以及電池技術等關鍵技術領域。該系列任務不僅為鋰電池研討領域的專家學者供給了詳盡的文獻梳理與專業評價,也為產業界和政策制訂者供給了無益的參考。

當前,全球研發處于高速發展階段,科學文獻數量呈現爆炸式增長,科學概念也呈現線性擴展趨勢。在鋰電池這一特定領域,科學文獻持續地年夜規模增長也帶來了史無前例的新挑戰。一是面對海量的科學文獻和不斷涌現的新概念或主題,信息的獲取和治理已成為一年夜難題。這請求研討者采取有用的戰略來篩選和處理主要文獻,以堅持對領域最新研討的清楚,同時還需防止因信息過載而導致認知負擔。二是現有文獻點評和梳理任務能夠難以周全處理和應對科學文獻的爆炸性增長。例如,從“鋰電池百篇論文點評”的第一期(2012年10月至11月)僅有824篇新論文發表,到發表在2024年3期的這篇(2023年12月至2024年1月)的6213篇新論文,文獻數量指數級的增長無疑加年夜了文獻選擇的難度和誤差風險,能夠會影響到對科學發展規律和特點的真實、準確反應。三是面包養甜心網對數以萬計的科學文獻,研討者常用的戰略是選擇那些較有研討深度和潛在應用價值、高被引、發表在高影響力期刊或由著名專家撰寫的論文進行梳理。但是,這種戰略能夠也會疏忽一些同樣具有價值的論文或研討主題,構成關注“盲區”,導致部門有價值的研討結果未能獲得應有的關注和認可。

隨著人工智能技術的疾速發展,特別是深度學習和年夜語言模子,年夜規包養金額模科學文獻的綜合化和自動化剖析逐漸成為能夠。這些技術在文本發掘上的潛力,為從海量文獻中提取有價值信息供給了創新的解決計劃。在鋰電池研討領域,應用這些方式提醒知識體系和趨勢,是一個充滿遠景的研討標的目的。本文運用年夜數據和機器學習技術,采用BERTopic主題模子,對全球鋰電池相關論文進行了系統性文天職析,構建了一個鋰電池研討領域的主題圖。研討不僅提醒了新興研討主題,還追蹤了在學術界具有廣泛影響力的熱點主題,有助于懂得鋰電池研討的最新進展和趨勢,并為數據驅動的決策供給支撐。此外,通過將BERTopic剖析結果與“鋰電池百篇論文點評”系列關注主題進行對比,探討了科學文獻監測與科學文獻全局之間的關系,進而為未來的研討和文獻監測任務供給參考和支撐。

1 研討框架和方式

研討包含以下四個步驟:①數據搜集與婚配:構建鋰電池檢索式,搜集論文數據和“鋰電池百篇論文點評”系列援用論文,并進行婚配。②主題識別:提取摘要文本,采用BERTopic主題模子進行剖析,聚類并識別重要研討主題。③新興主題和高被引主題識別:結合主題的發文時間均勻值、復合年增長率,識別新興主題;應用箱線圖對分歧主題的被引次數進行剖析,識別高被引主題。④監測主題對比剖析:應用“鋰電池百篇論文點評”系列文章中各主題出現的論文數量與該主題一切論文數量的比值,評估監測主題的代表性,結合主題的發文時間均勻值,剖析新興主題能否獲得充足關注。

1.1 數據搜集與婚配

本文選擇Web of Science數據庫,結合關鍵詞和引文主題構建檢索式。采用鋰電池相關術語,如“lithium*”與“batter*”的組合,以及“lithium-ion batter*”“Li-ion batter*”“Li batter*”和“lithium-ion cell*”等,構建檢索式:TS=(“lithium*” AND “batter*”)OR TS=(“lithium-ion batter*” OR “Li-ion batter*” OR “Li batter*” OR “lithium-ion cell*”)。同時,還考慮了微觀級別的引文主題,如“2.62.138 Lithium-Ion Battery”和“2.62.616 Lithium-Sulfur Batteries”。在文獻類型上,選擇論文、會議錄論文、綜述論文和在線發表論文,時間跨度為1990年1月1日至2024年1月31日,獲得鋰電池相關論文188687篇。在此基礎上進行預處理,刪往摘要缺掉、數據有誤的文獻,獲得186060篇論文構建了鋰電池論文數據集。

特別關注了“鋰電池百篇論文點評”系列文章中所援用的論文,并將這些參考文獻與鋰電池論文數據集的結果進行婚配。起首下載該系列在2012年12月1日至2024年1月31每日天期間發布的66篇論文,并進一個步驟提取了它們所援用的參考文獻,共計6589篇。然后,對提取的參考文獻進行往重處理,并刪往缺掉摘要等關鍵信息的文獻。最后,將這些參考文獻與搜集的鋰電池論文數據集的標題進行類似性得分計算,并進行人工對比獲得完整婚配的結果。在這一過程中,對鋰電池論文數據集進行標引,假如某篇文獻被“鋰電池百篇論文點評”系列文章援用,則其對應指標“Citation”設置為1,否則為0。最終篩選確定了6020篇論文,并與鋰電池論文數據集完整婚配。

1.2 主題識別

本文采用BERTopic主題模子對鋰電池領域的文獻摘要進行主題識別與發掘。BERTopic是一種基于預訓練模子的主題模子技術,由Maarten Grootendorst于2022年提出。這種方式能夠捕獲文獻主題信息,可用于客觀展現研討領域的宏觀面孔,并有助于發現未被充足關注到包養甜心網的主題。步驟如下。

(1)文本嵌進:每篇文獻視為一個獨立文檔,應用Sentence-BERT架構對摘要文本進行向量化處理,使得語義上附近的文檔在向量空間中彼此接近。

(2)非線性降維:為了下降高維向量空間的復雜度,采用UMAP(uniform manifold approximation and projection)非線性算法對文檔向量進行降維處理,將文檔映射到二維空間。

(3)文本聚類:應用HDBSCAN算法對降維后的文檔進行主題聚類,將類似的文檔歸為統一類簇。

(4)主題表現:通過KeyBERT和MMR算法,結合年夜語言模子和人工判斷,選擇既能代表主題焦點又彼此區分度高的關鍵詞,構成標簽作為主題表現。

(5)構建主題圖:基于聚類結果和文檔信息構建主題圖,直觀展現文獻的相對地位和主題分布。

1.3 主題剖析

本文剖析論文時間分布和被引次數,識別新興主題和高被引主題。在時間趨勢方面,應用山脊圖來觀察分歧時間各主題的論文發臉色況。山脊的高度表現對應主題在特定年份的論文發表密度,通過觀察山脊隨時間的升沉變化,判斷主題論文發表趨勢。然后,構建四象限圖來識別疾速增長的新興主題,橫軸代表每個主題的發文時間均勻值,反應主題的新穎性;縱軸表現各主題論文數量從2013年到2023年的復合年增長率(CAGR)。這樣,第一象限為疾速增長的新興主題,第二象限為成熟且增長較快的主題,第三象限是成熟但增長趨勢減緩的主題,第四象限是較新但增長趨勢減緩的主題。包養

在被引次數方面,應用箱線圖對分歧主題的被引次數進行了分布特征剖析。箱線圖包含最小值、第一四分位數(Q)、中位數(Q)、第三四分位數(Q)和最年夜值。箱體表包養網dcard現被引次數的中間50%分布范圍,中位線則代表被引次數的中位數。觸須從Q延長至最小值,以及從Q延長1.5倍的IQR,超越觸須范圍的點在天職析中未被特別標記為包養網異常值。箱線圖供給了對各主題被引次數的直觀懂得,展現分歧主題的被引分布的差異。

1.4 監測主題對比

在婚配“鋰電池百篇論文點評”系列文章的參考文獻與鋰電池論文數據集的基礎上,開展監測主題對比剖析。分別計算“鋰電池百篇論文點評”系列文章中各主題出現的論文數量與該主題一切論文數量的比值,評估監測主題的代表性。結合主題的發文時間和新興主題剖析結果,評估“鋰電池百篇論文點評”系列文章中哪些新興主題獲得較好的關注,而哪些新興主題的占比較低。

2 鋰電池研討主題剖析

2.1 論文趨勢剖析

自1990年以來,鋰電池領域相關論文數量呈現顯著的增長,可分為3個階段,如圖1所示。研討領域的活躍度逐年攀升,論文發表數量不斷刷新紀錄。以“鋰電池百篇論文點評”系列文章的肇端年份2012年為例,當年共發表了5110篇論文,而到了2023年,這一數字激增至20246篇,接近于1990—2008年19年間累計發文總量的20610篇。這一躍升不僅凸顯了鋰電池研討的疾速增長,也反應出該領域在全球科研任務中的日益主要性。

第一階段(1990—1999年)是初期摸索期,論文數量相對較少,例如,1990年僅有18篇論文發表,而到了1999年,論文數量增長至1058篇。這一時期研討關注鋰電池概念和技術道理,重視資料的開發和電池的機能測試,以進步電池的機能和平安性。

第二階段(2000—2010年)是穩步發展期,論文數量顯著增添,從2000年的1215篇增長至2010年的2998篇。這一時期的研討領域開始擴展到電池的年夜規模應用和機能改進,關注進步電池的能量密度、平安性和循環壽命,并深刻摸索了新的電極資料和先進的電解液配方。便攜式電子設備的普及,如筆記本電腦和智妙手機,對更高效、更靠得住的電池的需求日益增長,這直接推動了鋰電池機能的優化和生產技術的改進。此外,電動汽車的初步商業化也為鋰電池的研討帶來了新的動力,促使研討者努力于制造高能量、高功率的鋰電池,下降系統本錢并進步應用壽命。

第三階段(2011年至今)是疾速增長期,論文數量呈現出爆炸性的增長,這與電動汽車市場的興起和可再生動力儲能需求的增添親密相關。鋰電池領域的研討活動顯著加快,研討重點關注進步電池的能量密度、循環壽命和下降本錢,不僅在傳統的電池資料和化學方面獲得了衝破,還在電池的系統集成、治理技術、充包養站長放電戰略上實現了改革。研討者還深刻探討鋰電池的電化學機理,開發了更平安、更長壽命的電池系統,如固態鋰電池和高鎳三元資料電池,以適應高端電動汽車和年夜規模儲能系統的需求。此外,隨著全球鋰離子電池應用量的不斷增添,鋰電池收受接管和二次應用至關主要,在應對資料稀缺、保護天然資源、減少淨化等方面發揮著主要感化。

2.2 主題模子剖析

應用BERTopic主題模子對186060篇論文進行建模,設定最小集群規模為500篇,獲得46個主題,通過KeyBERT和MMR算法提取的主題關鍵詞,結合年夜語言模子和人工篩選確定了主題標簽,構建鋰電池領域的主題圖,如圖2所示。主題圖客觀反應了18萬余篇鋰電池論文及其研討主題的分布,它由帶顏色的點組成,每個點代表一篇論文,其坐標由UMAP算法將論文的詞嵌進向量降至兩個維度獲得。主題圖的橫軸和縱軸并無直接解釋,可看作是46個主題論文之間類似性的二維展現,距離較近的點表現相應論文在主題上的類似性較高。點的顏色根據HBSCAN算法聚類獲得,分歧顏色對應分歧的主題。主題的標簽則放置在與每個主題相關的論文集群的中間,并進行編號,標簽字體鉅細根據主題對應的論文數量進行設置。

主題圖是鋰電池領域論文知識的高度有序化展現,涵蓋了從資料創新、電化學機能研討,到電池設計、應用以及可持續發展等多個關鍵標的目的。相關主題的文獻緊密湊集,構成了明顯的集群。普通來說,面向電池治理和系統的主題位于主題圖上方,而電池資料、組件相關研討則集中在主題圖下方。更細化的研討領域也可以區分出來,例如電極相關主題在主題圖的右下方,電解質相關主題則位于主題圖的中間和左部門。

具體來包養感情看,電池系統研討和治理相關主題涵蓋電池電源治理系統(0. battery power management systems),相關內容與電池收受接管和金屬收受接管(10. battery recycling and metal recovery)關聯,位于主題圖上方。

電池系統從應用領域可分為:動力電池系統和儲能電池系統,是確保電池高效治理、平安運行的關鍵焦點技術,在電動汽車和光伏系統等能量存儲中發揮著主要感化。在電池系統中重要包含:①動力(或儲能)電池及機械總成、高壓電氣系統、熱治理系統;②電池治理系統(B包養女人MS)等組成,觸及的專業領域包含電氣、電子、信息、軟件工程、電磁學、半導體、資料、電化學、化學工程、機械工程、傳熱學、工程熱力學、流體力學等眾多學科,技術整合難度和系統集成復雜度很是高。

BMS是電池系統最關鍵的組件之一,由各種傳感器、執行器和把持器組成,包含電池參數檢測、狀態估計、毛病診斷、熱治理、充電治理、平衡、通訊、數據存儲等效能。通過靠得住的治理機制與把持算法,估計電池狀態(SOC、SOH、SOP、SOE等),協調整車把持系統(或儲能EMS系統)任務,確保電池系統任務在公道的溫度和負荷區間內,滿足分歧應用領域的系統任務請求,也能保證電池系統在整個性命周期內平安、穩定、靠得住地任務。為了進步電池的應用效力和壽命,研討人員設計了多種電池治理算法,如卡爾曼濾波器被廣泛用于電池荷電狀態(SOC)和安康狀態(SOH)估計,對于預測電池行為、延長電池壽命、避免過充和過放等至關主要,是實現電池電源治理系統智能化和自動化的關鍵技術。

電池收受接管和金屬收受接管也是主要研討標的目的,涵蓋了從資料的綠色分解、電池的高效應用到廢舊電池的收受接管與再應用等多個方面,包含鋰電池生產、應用到最終的廢棄和收受接管處理,凸起了環境持續性和資源循環應用在鋰電池產業中的主要性。

“一代資料,一代電池”,資料研討在鋰電池研討領域占包養網車馬費據主要地位,涵蓋數十個主題。此中,電極資料重要集中在主題圖的右下角,觸及正極、負極的各個關鍵組成部門。正極資料是鋰電池中至關主要的組成部門,直接影響電池的能量密度和循環穩定性。磷酸鐵鋰正極資料(7. iron phosphate cathode materials)因其高平安性、循環穩定性和低本錢而遭到廣泛應用,但磷酸鐵鋰電池在嚴寒氣候下運行時會遭到嚴重限制。層狀氧化錳正極(12. layered manganese oxide cathodes包養網評價)和尖晶石結構錳氧化物(13. spinel structure manganese oxide)因其高電壓平臺和本錢效益而遭到關注。例如Li1.2Ni0.2Mn0.6O2作為一類典範的富鋰錳基資料,具有極高的比容量(超過250 mAh/g),它進一個步驟激包養活了額外的陰離子氧化還原中間,理論容量可達300 mAh/g,遠高于現已商業化的正極資料。三元高鎳正極資料(11. nickel-rich cathode materials)則因其高能量密度和低本錢而備受關注,進步高鎳層狀氧化物中的鎳含量是進步鋰離子電池能量密度的有用途徑。鈷氧化物(20. cobalt oxide electrode materials)和銅氧化物(35. copper oxide electro甜心寶貝包養網de materials)因其在進步電池能量密度方面的潛力而被廣泛研討。

同樣,負極資料對鋰離子電池的電化學特徵起著至關主要的感化,相關研討同樣關鍵。石墨烯和石墨資料(32. graphene and graphite electrode materials)作為負極資料,以其優異的電導率和穩定性而廣泛 TC:sugarpopular900


留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *