電網(wǎng)是高效快捷的能源輸送通道和優(yōu)化配置平臺(tái),是能源電力可持續(xù)發(fā)展的關(guān)鍵環(huán)節(jié),在現(xiàn)代能源供應(yīng)體系中發(fā)揮著重要的樞紐作用,關(guān)系國家能源安全。2010年以來,國家電網(wǎng)規(guī)模增長近一倍,保障了經(jīng)濟(jì)社會(huì)發(fā)展對(duì)能源電力的需求。
隨著人工智能技術(shù)的快速發(fā)展,機(jī)器智能的優(yōu)勢正逐漸深入各行各業(yè)。自然語言處理技術(shù)作為人工智能領(lǐng)域最具代表也最有難度的研究課題,能夠?qū)θ祟愓Z言和文本類數(shù)據(jù)進(jìn)行處理和學(xué)習(xí)。智能電網(wǎng)的概念與自然語言處理的結(jié)合,則能夠衍生至通過文本閱讀理解,文本相似度計(jì)算,知識(shí)圖譜等技術(shù),在項(xiàng)目招標(biāo),檢測預(yù)警,維護(hù)修理,以及渠道客戶等電網(wǎng)業(yè)務(wù)的應(yīng)用場景當(dāng)中落地。提升電網(wǎng)業(yè)務(wù)的工作效率,造福廣大人民群眾。
一、電力行業(yè)的市場規(guī)模
2005年以來,智能電網(wǎng)關(guān)注度就逐漸提升,這既是現(xiàn)代電力系統(tǒng)日益復(fù)雜的要求。智能電網(wǎng)的概念是眾多技術(shù)、解決方案,甚至包括政策和監(jiān)管機(jī)制的合集。未來幾年,新能源裝機(jī)和發(fā)電量占比的提升必然趨勢,電網(wǎng)必將圍繞清潔能源消納進(jìn)行系統(tǒng)化的投資升級(jí)。而中東部地區(qū)興起的大量間歇性分布式并網(wǎng)也需要智能配電網(wǎng)絡(luò)的支撐。目前我國智能電網(wǎng)市場需求方主要是國家電網(wǎng),南方電網(wǎng),以及地方供電局和一些地方電力公司。目前,在市場里能夠提供較為全面的智能電網(wǎng)解決方案的供應(yīng)商還十分有限,但是大多數(shù)企業(yè)都已經(jīng)開始在某個(gè)或多個(gè)細(xì)分領(lǐng)域逐步展開智能化的戰(zhàn)略部署。
二、智能電網(wǎng)中的自然語言處理技術(shù)
文本信息抽取: 文本信息抽取主要是結(jié)合機(jī)器閱讀理解,通過訓(xùn)練Word2vec模型,將文本數(shù)據(jù)中有效的信息識(shí)別出來,實(shí)現(xiàn)可以制動(dòng)從文本數(shù)據(jù)中識(shí)別并抽取關(guān)鍵信息內(nèi)容的功能。文本信息抽取的技術(shù)可以應(yīng)用電網(wǎng)招標(biāo)文檔數(shù)據(jù)的結(jié)構(gòu)化整理,便于招標(biāo)文檔的聚類和整理。同時(shí)也適用于電網(wǎng)企業(yè)說明文檔的檢測管理以及檢測警報(bào)等任務(wù)
文檔相似度分析:文檔相似度主要是依賴文字內(nèi)容語義相似度計(jì)算的技術(shù)實(shí)現(xiàn)的一種典型NLP技術(shù)。一般用于信息檢索的和知識(shí)問答的模糊匹配。這項(xiàng)技術(shù)被運(yùn)用與電網(wǎng)維修行業(yè),維修人員可以通過提問,或關(guān)鍵字搜索的方式對(duì)信息量龐大的電網(wǎng)維修說明文檔進(jìn)行快速的檢索。系統(tǒng)可以找到精準(zhǔn)的相關(guān)內(nèi)容,并生成說明內(nèi)容返回給為維修人員。
知識(shí)圖譜: 知識(shí)圖譜能夠有效的將系統(tǒng)當(dāng)中的知識(shí)類信息進(jìn)行整理與關(guān)聯(lián),從而實(shí)現(xiàn)信息數(shù)據(jù)質(zhì)檢的相互聯(lián)結(jié)與溝通。針對(duì)包含專業(yè)技術(shù)和知識(shí)類文本數(shù)據(jù)組建圖數(shù)據(jù)庫,從而實(shí)現(xiàn)復(fù)雜的檢索功能和智能輔助決策的功能。通過圖數(shù)據(jù)庫提升文本信息的檢索質(zhì)量,可運(yùn)用電網(wǎng)管理監(jiān)控,電網(wǎng)知識(shí)類智能問答客服等場景。
情感識(shí)別:感情識(shí)別技術(shù)指的是通過對(duì)工作業(yè)務(wù)當(dāng)中對(duì)話內(nèi)容信息的聚類和理解,識(shí)別用戶在對(duì)話內(nèi)容中所表達(dá)的情感信息的技術(shù)。感情識(shí)別技術(shù)主要依靠長期短期記憶(LSTM)算法,對(duì)相關(guān)業(yè)務(wù)對(duì)話語料的上下文信息進(jìn)行學(xué)習(xí),結(jié)合對(duì)話當(dāng)中的語境信息,判斷對(duì)話內(nèi)容中所表達(dá)的情緒正負(fù)極,進(jìn)而理解對(duì)話內(nèi)容的話題與意圖。
三、自然語言處理在電力行業(yè)中應(yīng)用案例
電網(wǎng)檢測警報(bào):傳統(tǒng)的電網(wǎng)檢測警報(bào)無法對(duì)在短時(shí)間內(nèi)對(duì)發(fā)生的警報(bào)事件做出準(zhǔn)確的判斷。鑒于目前監(jiān)測報(bào)警信息效率低的現(xiàn)狀,人工智能技術(shù)為電網(wǎng)業(yè)務(wù)提供了有效的解決方案。首先,通過自然語言處理技術(shù)對(duì)報(bào)警信息文本的特征進(jìn)行分析和整理,并做好預(yù)處理工作;赪ord2vec模型對(duì)監(jiān)視警報(bào)信息進(jìn)行矢量化,最后,針對(duì)報(bào)警信息的特點(diǎn),建立了基于LSTM和CNN組合的監(jiān)控報(bào)警事件識(shí)別模型。該模型可以通過與多種識(shí)別模型的比較,以驗(yàn)證本文方法的可行性和有效性。
智能電網(wǎng)檢修問答系統(tǒng):通過機(jī)器閱讀理解技術(shù)將電網(wǎng)安規(guī)的文檔進(jìn)行讀取和分析,然后把文檔中的段落建索引。電網(wǎng)維修人員可以通過自然語言問答的形式提出問題,并得到相關(guān)的答案指導(dǎo)。當(dāng)維修人員向系統(tǒng)提問后,系統(tǒng)會(huì)先在索引里搜索相關(guān)段落,再從找到的段落中讀出問題答案。搜索返回的是段落,系統(tǒng)將段落內(nèi)容轉(zhuǎn)精煉成回答短語,返回輸出給維修人員。系統(tǒng)會(huì)理解文本內(nèi)容,之后再抽取原文的一部分內(nèi)容作為答案輸出。系統(tǒng)依賴bert 模型預(yù)測出來文章當(dāng)中哪一段能回答這個(gè)問題的概率最高。(學(xué)術(shù)的閱讀理解數(shù)據(jù)集上,人能做到86.8, 最好的模型做到88.6了)
智能電網(wǎng)招標(biāo)資料查重系統(tǒng):電網(wǎng)公司在項(xiàng)目招標(biāo)采購過程中, 一般要對(duì)招標(biāo)資料進(jìn)行查重工作, 在歷史項(xiàng)目資料庫中查找是否存在類似項(xiàng)目, 以防止項(xiàng)目重復(fù)招標(biāo)的情況發(fā)生, 避免資金浪費(fèi)。使用潛在語義索引的方法, 對(duì)文檔中的語義進(jìn)行分析, 使用自然語言處理領(lǐng)域的中文分詞、詞向量轉(zhuǎn)換、詞權(quán)重計(jì)算、主題建模等技術(shù)構(gòu)建了一套文檔相似度分析系統(tǒng)。該系統(tǒng)可在海量歷史項(xiàng)目資料庫中快速找出與目標(biāo)文檔相似的項(xiàng)目, 并計(jì)算出文檔相似度百分比, 輔助招標(biāo)采購專職判斷招標(biāo)資料是否合規(guī)。系統(tǒng)的研究與應(yīng)用, 對(duì)規(guī)范電網(wǎng)公司項(xiàng)目招標(biāo)采購管理具有重要實(shí)用價(jià)值。
渠道客戶偏好分析系統(tǒng):對(duì)于渠道客戶的管理是電網(wǎng)行業(yè)當(dāng)中的一個(gè)重要環(huán)節(jié)。通過自然語言處理技術(shù),可以有效的提高電力公司對(duì)渠道客戶的管理工作。智能渠道客戶偏好分析系統(tǒng)能夠通從客戶對(duì)接業(yè)務(wù)項(xiàng)目的文本信息中識(shí)別客戶對(duì)各種渠道使用的喜好程度、客戶與電網(wǎng)企業(yè)交互的活躍程度、客戶關(guān)注偏好類別, 有針對(duì)性地引導(dǎo)客戶進(jìn)行渠道轉(zhuǎn)移, 減少渠道服務(wù)成本。自然語言處理技術(shù)還能從客戶服務(wù)相關(guān)的語料數(shù)據(jù)中發(fā)現(xiàn)客戶投訴傾向分析指識(shí)別客戶投訴特征及變化規(guī)律, 對(duì)營銷業(yè)務(wù)、客戶基礎(chǔ)信息與客戶投訴之間進(jìn)行關(guān)聯(lián)分析。結(jié)合客戶服務(wù)歷史及歷史滿意度評(píng)價(jià)情況, 對(duì)服務(wù)過程中因服務(wù)行為、供電質(zhì)量等服務(wù)質(zhì)量引起的投訴和滿意度評(píng)價(jià)較低的信息進(jìn)行分析, 找出關(guān)聯(lián)關(guān)系。
四、自然語言理解在電網(wǎng)業(yè)務(wù)中發(fā)展趨勢
目前在電網(wǎng)行業(yè)中,NLP技術(shù)的主要應(yīng)用場景依然是輔助業(yè)務(wù)的智能客服中心。未來,將會(huì)有更多電網(wǎng)業(yè)務(wù)相關(guān)的數(shù)據(jù)被挖掘和記錄,屆時(shí)NLP技術(shù)將會(huì)進(jìn)一步的深入到電網(wǎng)成功具體的管理檢測和維護(hù)當(dāng)中。NLP技術(shù)在電網(wǎng)行業(yè)當(dāng)中的應(yīng)用剛剛起步,對(duì)數(shù)應(yīng)用還在實(shí)驗(yàn)和探索階段,中國國家電網(wǎng)和南方電網(wǎng)等企業(yè)正在積極與個(gè)大NLP公司和院校相關(guān)的實(shí)驗(yàn)室合作,共同探索人工智能技術(shù)在電網(wǎng)電力領(lǐng)域的應(yīng)用,推動(dòng)電網(wǎng)電力智能化的戰(zhàn)略方針,更好的服務(wù)于百姓。
五、自然語言理解在電網(wǎng)業(yè)務(wù)中的局限性
自然語言處理技術(shù)在電網(wǎng)領(lǐng)域當(dāng)中的應(yīng)用依然是一個(gè)正在探索和嘗試的課題。真正在實(shí)際場景中落地的項(xiàng)目非常有限,相關(guān)進(jìn)展主要來著科研高校以及科技公司的POC項(xiàng)目當(dāng)中。項(xiàng)目當(dāng)中的數(shù)據(jù)多為實(shí)驗(yàn)數(shù)據(jù),缺乏一定的客觀性和真實(shí)性。
從目前的發(fā)展現(xiàn)狀來看,電網(wǎng)行業(yè)中數(shù)據(jù)的獲取和整理將會(huì)是一個(gè)較大的挑戰(zhàn)。目前市面上還沒有一個(gè)很好的針對(duì)電網(wǎng)領(lǐng)域的NLP模型。電網(wǎng)領(lǐng)域的內(nèi)容具有一定的專業(yè)性,且需要進(jìn)行大量有效的人工標(biāo)注才能訓(xùn)練出一個(gè)有效的模型。另外,電網(wǎng)公司是比較傳統(tǒng)的能源類企業(yè),其工作方式以及工作系統(tǒng)已經(jīng)形成體系,相對(duì)于其他行業(yè)來說,電網(wǎng)業(yè)務(wù)智能化的替換成本更大,且門檻更高。短期之內(nèi),NLP在電網(wǎng)行業(yè)中的應(yīng)用多數(shù)還是以協(xié)助人類工作為目的,這就需要工作人員接受并掌握新的工作形式和模式。