創(chuàng)澤機(jī)器人 |
CHUANGZE ROBOT |
人機(jī)對(duì)話(huà)一直是自然語(yǔ)言處理領(lǐng)域內(nèi)的重要研究方向之一,近年來(lái)隨著人機(jī)交互技術(shù)的進(jìn)步,對(duì)話(huà)系統(tǒng)正逐漸走向?qū)嶋H應(yīng)用。其中,智能客服系統(tǒng)受到了很多企業(yè)尤其是中大型企業(yè)的廣泛關(guān)注。智能客服系統(tǒng)旨在解決傳統(tǒng)客服模式需要大量人力的狀況,在節(jié)約人力的同時(shí),使得人工客服在針對(duì)特別問(wèn)題或者特別用戶(hù)時(shí)能夠提供更高質(zhì)量的服務(wù),從而實(shí)現(xiàn)“智能客服 + 人工客服”在服務(wù)效率和服務(wù)質(zhì)量?jī)蓚(gè)維度上的整體提升。近年來(lái),許多中大型公司都已經(jīng)構(gòu)建了自己的智能客服體系,例如富士通的 FRAP、京東的 JIMI 和阿里巴巴的 AliMe 等。
智能客服系統(tǒng)的構(gòu)建需要依托于行業(yè)數(shù)據(jù)背景,并基于海量知識(shí)處理和自然語(yǔ)言理解等相關(guān)技術(shù)。初代智能客服系統(tǒng)主要面對(duì)業(yè)務(wù)內(nèi)容,針對(duì)高頻的業(yè)務(wù)問(wèn)題進(jìn)行回復(fù)解決,此過(guò)程依賴(lài)于業(yè)務(wù)專(zhuān)家對(duì)高頻業(yè)務(wù)問(wèn)題答案的準(zhǔn)確整理,主要的技術(shù)點(diǎn)在于精準(zhǔn)的用戶(hù)問(wèn)題和知識(shí)點(diǎn)之間的文本匹配能力。新型的智能客服系統(tǒng)將服務(wù)范圍定義為泛業(yè)務(wù)場(chǎng)景,除了解決處理核心的高頻業(yè)務(wù)問(wèn)題,智能導(dǎo)購(gòu)能力、障礙預(yù)測(cè)能力、智能語(yǔ)聊能力、生活助理功能以及生活?yuàn)蕵?lè)交互等方面的需求也同樣被重視和涵蓋。其中,情感能力做為類(lèi)人能力的重要體現(xiàn),已經(jīng)在智能客服系統(tǒng)的各個(gè)維度的場(chǎng)景中被實(shí)際應(yīng)用,并且對(duì)系統(tǒng)類(lèi)人能力的提升起到了至關(guān)重要的作用。
一 智能客服系統(tǒng)中情感分析技術(shù)架構(gòu)
圖 1:智能客服系統(tǒng)中的情感分析技術(shù)架構(gòu)
圖 1 給出了經(jīng)典的人機(jī)結(jié)合的智能客服模式,用戶(hù)能夠通過(guò)對(duì)話(huà)的方式,接受來(lái)自機(jī)器人或者人工客服的服務(wù),并且在接受機(jī)器人服務(wù)的過(guò)程中,能夠利用指令的方式或者機(jī)器人自動(dòng)識(shí)別的方式跳轉(zhuǎn)到人工客服。在上述的完整客服模式中,情感分析技術(shù)已經(jīng)被實(shí)際應(yīng)用在多個(gè)維度的能力之上。
二 用戶(hù)情感檢測(cè)
1 用戶(hù)情感檢測(cè)模型介紹
用戶(hù)情感檢測(cè)是很多情感相關(guān)應(yīng)用的基礎(chǔ)和核心。在本文中,我們提出一種集成詞語(yǔ)義特征、多元詞組語(yǔ)義特征和句子級(jí)語(yǔ)義特征的情感分類(lèi)模型,用于識(shí)別智能客服系統(tǒng)用戶(hù)對(duì)話(huà)中包含的“著急”、“氣憤”和“感謝”等情感。關(guān)于不同層次語(yǔ)義特征的抽取技術(shù),相關(guān)工作中已經(jīng)多有提及,我們將不同層次的語(yǔ)義特征結(jié)合到一起,能夠有效提升最終的情緒識(shí)別效果。圖 2 給出了該情感分類(lèi)模型的架構(gòu)圖。
圖 2:智能客服系統(tǒng)中的用戶(hù)情感檢測(cè)模型
2 句子級(jí)語(yǔ)義特征抽取
Shen 等人[3]提出 SWEM 模型,該模型將簡(jiǎn)單的池化策略應(yīng)用于詞嵌入向量,實(shí)現(xiàn)句子級(jí)別的語(yǔ)義特征抽取,并且基于此類(lèi)特征進(jìn)行訓(xùn)練得到的分類(lèi)模型和文本匹配模型能夠得到與經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)類(lèi)模型和循環(huán)神經(jīng)網(wǎng)絡(luò)類(lèi)模型幾乎持平的實(shí)驗(yàn)效果。
在我們的模型中,我們利用 SWEM 模型的特征抽取能力,獲取用戶(hù)問(wèn)題的句子級(jí)別語(yǔ)義特征,并將其用于對(duì)用戶(hù)問(wèn)題的情感分類(lèi)模型中。
3 多元詞組語(yǔ)義特征抽取
傳統(tǒng)的 CNN 模型在很多情況下被用于抽取 n 元詞組語(yǔ)義特征,其中 n 是一個(gè)變量,表示卷積窗口大小。在本文中,我們根據(jù)經(jīng)驗(yàn)將 n 分別設(shè)置為 2、3 和 4,并且針對(duì)每一種窗口大小,我們分別設(shè)置 16個(gè) 卷積核,以用于從原始的詞向量矩陣中抽取豐富的 n 元詞組語(yǔ)義信息。
4 詞級(jí)別語(yǔ)義特征抽取
我們利用 LEAM 模型 [1] 抽取詞級(jí)別的語(yǔ)義特征。LEAM 模型同時(shí)將詞語(yǔ)和類(lèi)別標(biāo)簽進(jìn)行同維度語(yǔ)義空間的嵌入式表示,并且基于該表示進(jìn)行文本分類(lèi)任務(wù)的實(shí)現(xiàn)。LEAM 利用類(lèi)別標(biāo)簽的表示,增加了詞語(yǔ)和標(biāo)簽之間的語(yǔ)義交互,以此達(dá)到對(duì)詞級(jí)別語(yǔ)義信息更深層次的考慮。圖 3(2)中給出了類(lèi)別標(biāo)簽和詞語(yǔ)之間的語(yǔ)義交互的圖示,并且給出了 LEAM 模型與傳統(tǒng)模型之間的對(duì)比。
圖 3:LEAM模型中詞語(yǔ)和類(lèi)別標(biāo)簽之間的語(yǔ)義交互(傳統(tǒng)方法和LEAM模型的對(duì)比)
最后,不同級(jí)別的語(yǔ)義特征會(huì)在被合并在一起之后,輸入到整個(gè)模型的最后一層,由邏輯回歸模型進(jìn)行最終的分類(lèi)訓(xùn)練。
表 1 中給出了我們提出的集成式模型和三個(gè)只考慮單個(gè)層次特征的對(duì)比模型之間的線(xiàn)上真實(shí)評(píng)測(cè)效果對(duì)比結(jié)果。
表 1:集成模型和三種 baseline 模型的效果對(duì)比
三 用戶(hù)情感安撫
1 用戶(hù)情緒安撫整體框架介紹
本文中提出的用戶(hù)情緒安撫框架包括離線(xiàn)部分和在線(xiàn)部分,如圖 4 所示。
圖 4:用戶(hù)情緒安撫整體框架
離線(xiàn)部分
首先需要對(duì)用戶(hù)的情緒進(jìn)行識(shí)別。此處我們選取了需要安撫的用戶(hù)常見(jiàn)的七種情緒進(jìn)行識(shí)別,它們是害怕、辱罵、失望、委屈、著急、氣憤和感謝。
其次,我們對(duì)用戶(hù)問(wèn)題中包含的主題內(nèi)容進(jìn)行識(shí)別,此處由專(zhuān)門(mén)的業(yè)務(wù)專(zhuān)家總結(jié)了用戶(hù)常見(jiàn)的 35 種主題表達(dá)內(nèi)容,包括“抱怨服務(wù)質(zhì)量”和“反饋物流太慢”等。主題識(shí)別模型,我們使用與情緒識(shí)別同樣的分類(lèi)模型設(shè)計(jì)。
知識(shí)構(gòu)建是針對(duì)一些用戶(hù)表達(dá)內(nèi)容更具體的情況,整理其中高頻出現(xiàn)的并且需要進(jìn)行安撫的用戶(hù)問(wèn)題。這些具體的用戶(hù)問(wèn)題之所以沒(méi)有合并到上述的主題維度進(jìn)行統(tǒng)一處理,是因?yàn)橹黝}維度的處理還是相對(duì)粗粒度一些,我們希望針對(duì)這些高頻的更聚焦的問(wèn)題,同樣進(jìn)行更聚焦的安撫回復(fù),實(shí)現(xiàn)更好的回復(fù)效果。
針對(duì)情緒維度、“情緒 + 主題”維度和高頻用戶(hù)問(wèn)題維度,業(yè)務(wù)專(zhuān)家分別整理了不同粒度的安撫回復(fù)話(huà)術(shù)。特別地,在高頻用戶(hù)問(wèn)題維度,我們將每一個(gè)“問(wèn)題 - 回復(fù)”搭配稱(chēng)為一條知識(shí)。
在線(xiàn)部分
基于知識(shí)的安撫是針對(duì)帶有具體情緒內(nèi)容表達(dá)的用戶(hù)進(jìn)行安撫,在此我們使用了一種文本匹配模型來(lái)評(píng)價(jià)用戶(hù)問(wèn)題與我們整理好的知識(shí)中的問(wèn)題的匹配度。如果在我們整理好的知識(shí)中存在與當(dāng)前用戶(hù)輸入問(wèn)題意思非常相近的問(wèn)題,則對(duì)應(yīng)的回復(fù)直接返回給用戶(hù)。
基于情緒和主題的情感回復(fù),是指同時(shí)考慮用戶(hù)表達(dá)內(nèi)容中包含的情緒和主題信息,給予用戶(hù)合適的情感回復(fù)。相比于基于知識(shí)的安撫,此種方式的回復(fù)會(huì)更加的泛化一些。
基于情緒類(lèi)別的情感回復(fù),是只考慮用戶(hù)表達(dá)內(nèi)容中的情緒因素而對(duì)用戶(hù)進(jìn)行相應(yīng)的安撫回復(fù)。此回復(fù)方式是上述兩種回復(fù)方式的補(bǔ)充和兜底,同時(shí)回復(fù)的內(nèi)容也會(huì)更加的通用。
圖 5:用戶(hù)情緒安撫示例
圖 5 給出了在線(xiàn)情感安撫的三個(gè)示例,分別對(duì)應(yīng)上述的三種不同層面的回復(fù)機(jī)制。 表 2:需要安撫的情感分類(lèi)效果對(duì)比
表 2 給出了針對(duì)需要安撫情感的分類(lèi)模型效果對(duì)比,包括每種情感類(lèi)別的單獨(dú)效果以及最終的整體效果。表 3 給出了針對(duì)主題的分類(lèi)模型效果對(duì)比。表4給出了針對(duì)幾種負(fù)面情感,增加了情緒安撫之后,用戶(hù)滿(mǎn)意度的提升效果。表 5 給出了針對(duì)感激這種情感,增加了情緒安撫之后,用戶(hù)滿(mǎn)意度的提升效果。 表 3:主題分類(lèi)效果對(duì)比 表 4:負(fù)面情緒安撫對(duì)用戶(hù)滿(mǎn)意度的效果對(duì)比 表 5:感激情感安撫對(duì)用戶(hù)滿(mǎn)意度的效果對(duì)比
四 情感生成式語(yǔ)聊
1 情感生成式語(yǔ)聊模型
圖 6 中給出了智能客服系統(tǒng)中的情感生成式語(yǔ)聊的模型圖。圖中,source RNN 起到了編碼器的作用,將源序列s映射為一個(gè)中間語(yǔ)義向量 C,而 target RNN 作為解碼器,則能夠根據(jù)語(yǔ)義編碼 C 以及我們?cè)O(shè)定的情緒表示 E 和主題表示 T,解碼得到目標(biāo)序列 y。此處的 s 和 y,分別對(duì)應(yīng)圖中由詞語(yǔ)序列組成的“今天心情很好”和“好開(kāi)心呀!”兩個(gè)句子。
通常,為了使解碼器能夠保留來(lái)自編碼器的信息,編碼器的最后一個(gè)狀態(tài)將作為初始狀態(tài)傳遞給解碼器。同時(shí),編碼器和解碼器往往使用不同的 RNN 網(wǎng)絡(luò)用以捕獲問(wèn)句和回復(fù)句不同的表達(dá)模式。具體的計(jì)算公式如下:
雖然基于 Seq2Seq 的對(duì)話(huà)生成模型取得了不錯(cuò)的效果,但是在實(shí)際應(yīng)用中模型很容易生成安全但是無(wú)意義的回復(fù)。原因在于該模型中的解碼器僅僅接收到編碼器最后的一個(gè)狀態(tài)輸出 C,這種機(jī)制對(duì)處理長(zhǎng)期依賴(lài)效果不佳,因?yàn)榻獯a器的狀態(tài)記憶隨著新詞的不斷生成會(huì)逐漸減弱甚至丟失源序列的信息。緩解這個(gè)問(wèn)題的一個(gè)有效方式是引入注意力機(jī)制[2]。
圖 6:智能客服系統(tǒng)中的情感生成式語(yǔ)聊模型
2 情感生成式語(yǔ)聊模型結(jié)果
模型訓(xùn)練完成之后,在真實(shí)的用戶(hù)問(wèn)題上進(jìn)行測(cè)試,結(jié)果由業(yè)務(wù)專(zhuān)家進(jìn)行檢查,最終的答案合格率約為 72%。另外,回復(fù)文本的平均長(zhǎng)度為 8.8 個(gè)字,非常符合阿里小蜜語(yǔ)聊場(chǎng)景中對(duì)回復(fù)長(zhǎng)度的需求。表 6 中給出了本文模型 AET(Attention-based emotional & topical Seq2Seq model)與傳統(tǒng) Seq2Seq 模型的效果對(duì)比。對(duì)比主要集中在內(nèi)容合格率以及回復(fù)長(zhǎng)度兩個(gè)方面。添加了情緒信息之后,回復(fù)內(nèi)容較之傳統(tǒng) seq2seq 模型會(huì)更為豐富,而符合用研分析的“5 - 20字”最佳機(jī)器人語(yǔ)聊回復(fù)長(zhǎng)度的內(nèi)容占比也會(huì)大幅增加,最終使得整體的回復(fù)合格率提升明顯。
圖 7 中給出了阿里小蜜情緒生成式語(yǔ)聊模型在小蜜空間中的應(yīng)用示例。圖中兩個(gè)答案均由情緒生成式模型給出,并且,對(duì)于用戶(hù)辱罵機(jī)器人太傻的用戶(hù)輸入,我們的模型可以根據(jù)設(shè)置的對(duì)應(yīng)合理的話(huà)題和情緒,產(chǎn)生不同的答案,豐富了答案的多樣性,圖中兩個(gè)答案,則是由‘委屈’和‘抱歉’兩個(gè)情緒產(chǎn)生。 圖 7:小蜜空間中的情緒生成式語(yǔ)聊應(yīng)用實(shí)例
五 客服服務(wù)質(zhì)檢
1 客服服務(wù)質(zhì)量問(wèn)題定義
本文所說(shuō)的客服服務(wù)質(zhì)檢是針對(duì)人工客服在和客戶(hù)對(duì)話(huà)的過(guò)程中可能出現(xiàn)的存在問(wèn)題的服務(wù)內(nèi)容進(jìn)行檢測(cè),從而更好地發(fā)現(xiàn)客服人員在服務(wù)過(guò)程中存在的問(wèn)題并協(xié)助客服人員進(jìn)行改進(jìn),達(dá)到提高客服服務(wù)質(zhì)量,最終提高客戶(hù)滿(mǎn)意度效果。據(jù)作者所知,目前還沒(méi)有公開(kāi)實(shí)現(xiàn)的針對(duì)客服系統(tǒng)中客服服務(wù)質(zhì)量檢測(cè)的人工智能相關(guān)算法模型。
與人機(jī)對(duì)話(huà)不同,人工客服和客戶(hù)的對(duì)話(huà)并不是一問(wèn)一答形式,而是客戶(hù)和客服分別能夠連續(xù)輸入多句文本。我們的目標(biāo)是檢測(cè)每一句客服的話(huà)術(shù)內(nèi)容是否包含“消極”或者“態(tài)度差”兩種服務(wù)質(zhì)量問(wèn)題。
2 客服服務(wù)質(zhì)檢模型
為了檢測(cè)一句客戶(hù)話(huà)術(shù)的服務(wù)質(zhì)量,我們需要考慮其上下文內(nèi)容,包括用戶(hù)問(wèn)題和客服話(huà)術(shù)。我們考慮的特征包括文本長(zhǎng)度、說(shuō)話(huà)人角色和文本內(nèi)容。其中,針對(duì)文本內(nèi)容,除了利用 SWEM 模型對(duì)待檢測(cè)的當(dāng)前客服話(huà)術(shù)進(jìn)行特征抽取,我們還對(duì)上下文中的每輪話(huà)術(shù)進(jìn)行情緒檢測(cè),發(fā)現(xiàn)用戶(hù)情緒類(lèi)別和客服情緒類(lèi)別作為模型特征,而此處使用的情緒識(shí)別模型也如第 2 章中所述一致,亦不再贅述。此外,我們還考慮了兩種結(jié)構(gòu)(圖 8 中模型 1 和圖 9 中模型 2)對(duì)基于上下文內(nèi)容的文本序列語(yǔ)義特征進(jìn)行抽取。
其中,模型 1 在對(duì)當(dāng)前客服話(huà)術(shù)及其上下文每句文本進(jìn)行基于 GRU 或 LSTM 的編碼之后,針對(duì)編碼結(jié)果,考慮利用正向和反向 GRU 或者 LSTM 分別對(duì)當(dāng)前待檢測(cè)客服話(huà)術(shù)的上文和下文的編碼結(jié)果進(jìn)行再次的序列化編碼,如此得到的兩個(gè)序列化編碼結(jié)果均是以當(dāng)前話(huà)術(shù)為尾句,能夠更好的體現(xiàn)當(dāng)前話(huà)術(shù)的語(yǔ)義信息。模型結(jié)構(gòu)如圖 8 所示。
另外,模型 2 將當(dāng)前客服話(huà)術(shù)及其上下文的編碼結(jié)果,再次按照前后順序進(jìn)行整體的正向 GRU 或 LSTM 編碼作為最終的語(yǔ)義特征。模型結(jié)構(gòu)的部分展示如圖 9 所示。模型 1 與模型 2 相比,模型1會(huì)更加凸顯當(dāng)前待檢測(cè)話(huà)術(shù)的語(yǔ)義信息,而模型 2 則更加多得體現(xiàn)整體上下文的序列化語(yǔ)義信息。
我們比較兩種上下文語(yǔ)義信息抽取模型的效果,表7中給出了對(duì)比結(jié)果,結(jié)果顯示模型 1 的效果要優(yōu)于模型 2,可見(jiàn)對(duì)于當(dāng)前待檢測(cè)話(huà)術(shù)的語(yǔ)義信息確實(shí)需要給予更多的權(quán)重,而上下文的語(yǔ)義信息可以起到輔助識(shí)別的作用。此外,之前提到的 GRU 或者 LSTM 兩種方法在實(shí)際的模型訓(xùn)練過(guò)程中,效果差別不大,但是 GRU 方法要比 LSTM 方法在速度上更快一些,因此所有的模型實(shí)驗(yàn)過(guò)程中均使用了 GRU 方法。
此外,區(qū)別于模型層面的指標(biāo)分析,我們針對(duì)模型在實(shí)際的系統(tǒng)層面的指標(biāo)也進(jìn)行了相應(yīng)的分析,包括了質(zhì)檢效率以及召回率兩個(gè)維度。這兩個(gè)指標(biāo),我們是以模型的結(jié)果與之前純?nèi)斯べ|(zhì)檢的結(jié)果進(jìn)行對(duì)比得到。如表 8 中所示,不管是質(zhì)檢效率還是質(zhì)檢的召回率都得到了非常大的提升。其中,人工質(zhì)檢的召回率比較低的原因,是因?yàn)槿斯げ豢赡軝z測(cè)所有的客服服務(wù)記錄。 表 8:實(shí)際系統(tǒng)層面的模型指標(biāo)評(píng)價(jià)結(jié)果
六 會(huì)話(huà)滿(mǎn)意度預(yù)估
1 會(huì)話(huà)滿(mǎn)意度
目前在智能客服系統(tǒng)的性能評(píng)估指標(biāo)中,有一項(xiàng)最為重要的指標(biāo)為用戶(hù)會(huì)話(huà)滿(mǎn)意度。而針對(duì)智能客服系統(tǒng)中的用戶(hù)會(huì)話(huà)滿(mǎn)意度自動(dòng)預(yù)估的工作,據(jù)作者所知還沒(méi)有相關(guān)的研究成果。
針對(duì)智能客服系統(tǒng)中的會(huì)話(huà)滿(mǎn)意度預(yù)估場(chǎng)景,我們提出了會(huì)話(huà)滿(mǎn)意度分析模型,可以更好的反應(yīng)當(dāng)前用戶(hù)對(duì)智能客服的滿(mǎn)意度程度。由于不同用戶(hù)存在評(píng)價(jià)標(biāo)準(zhǔn)差異,會(huì)存在大量會(huì)話(huà)內(nèi)容、會(huì)話(huà)答案來(lái)源、會(huì)話(huà)情緒信息完全相同的情況下情緒類(lèi)別不一致的情況。因此我們采用了兩種模型訓(xùn)練方式:第一種是訓(xùn)練模型擬合情緒類(lèi)別(滿(mǎn)意、一般、不滿(mǎn)意)的分類(lèi)模型,另一種是訓(xùn)練模型擬合會(huì)話(huà)情緒分布的回歸模型,最后對(duì)兩種方式效果做了對(duì)比。
2 會(huì)話(huà)滿(mǎn)意度特征選取
會(huì)話(huà)滿(mǎn)意度模型考慮了各種維度信息:語(yǔ)義信息(用戶(hù)話(huà)術(shù))、情緒信息(通過(guò)情感檢測(cè)模型獲。、答案來(lái)源信息(回復(fù)當(dāng)前話(huà)術(shù)的答案來(lái)源)。
語(yǔ)義信息是用戶(hù)與智能客服交流過(guò)程中所表達(dá)的內(nèi)容信息,它可以從用戶(hù)話(huà)術(shù)中較好反應(yīng)用戶(hù)當(dāng)前滿(mǎn)意狀況。我們?cè)谀P椭惺褂玫恼Z(yǔ)義信息是指會(huì)話(huà)中的多輪話(huà)術(shù)信息,在模型處理過(guò)程中,為了保證每次模型能夠處理相同輪次的話(huà)術(shù),我們實(shí)驗(yàn)中只使用會(huì)話(huà)中最后4句用戶(hù)話(huà)術(shù),選擇此種方式的原因是通過(guò)會(huì)話(huà)數(shù)據(jù)分析,用戶(hù)在會(huì)話(huà)即將結(jié)束時(shí)的語(yǔ)義信息與整體會(huì)話(huà)滿(mǎn)意程度更為相關(guān)。比如,用戶(hù)在會(huì)話(huà)結(jié)尾時(shí)表達(dá)感激之類(lèi)的話(huà)術(shù)基本表示滿(mǎn)意,而表達(dá)批評(píng)之類(lèi)的話(huà)術(shù)則很可能表示了對(duì)服務(wù)的不滿(mǎn)。
情緒信息一般在用戶(hù)滿(mǎn)意度方面起著非常大的參考作用,當(dāng)用戶(hù)出現(xiàn)憤怒、辱罵等極端情緒時(shí),用戶(hù)反饋不滿(mǎn)意的概率會(huì)極大。此處的情緒信息與語(yǔ)義信息中的話(huà)術(shù)一一對(duì)應(yīng),對(duì)選取的幾輪話(huà)術(shù)分別進(jìn)行情緒識(shí)別,獲取對(duì)應(yīng)的情緒類(lèi)別信息。
答案來(lái)源信息可以很好的反應(yīng)用戶(hù)遇到何種問(wèn)題,由于不同的答案來(lái)源代表著不同業(yè)務(wù)場(chǎng)景,不同場(chǎng)景問(wèn)題產(chǎn)生的用戶(hù)滿(mǎn)意度狀況差異性比較明顯。比如,投訴、維權(quán)類(lèi)會(huì)比咨詢(xún)類(lèi)更容易導(dǎo)致用戶(hù)不滿(mǎn)意。
3 會(huì)話(huà)滿(mǎn)意度模型
在本文中,我們提出了結(jié)合語(yǔ)義信息特征、情緒信息特征和答案來(lái)源信息特征的會(huì)話(huà)滿(mǎn)意度預(yù)估模型。模型充分考慮了會(huì)話(huà)中的語(yǔ)義信息,并且使用了數(shù)據(jù)壓縮的方式將情緒信息和答案來(lái)源信息進(jìn)行了充分表達(dá)。模型結(jié)構(gòu)如圖 10 所示。
語(yǔ)義特征抽取。語(yǔ)義信息抽取方式使用層次 GRU/LSTM,第一層獲取每句話(huà)的句子表示(圖 10 中 first layer GRU/LSTM 部分),第二層根據(jù)第一層句子表示結(jié)果獲得多輪用戶(hù)話(huà)術(shù)的高階表示。
圖 10:智能客服系統(tǒng)中的用戶(hù)會(huì)話(huà)滿(mǎn)意度預(yù)估模型
(圖 10 中 second layer GRU/LSTM 部分),此處充分利用了用戶(hù)話(huà)術(shù)的序列信息。除此之外,還將獲取最后一句話(huà)的 SWEM 句子特征,以增強(qiáng)最后一句話(huà)術(shù)語(yǔ)義特征的影響。
情緒特征抽。河捎讷@取的情緒特征是 one-hot 類(lèi)型,而 one-hot 缺點(diǎn)比較明顯,數(shù)據(jù)稀疏且無(wú)法表示情緒間直接關(guān)系。此處我們學(xué)習(xí)一個(gè)情緒 embedding,來(lái)更好的表達(dá)情緒特征。
答案來(lái)源特征抽。撼跏即鸢竵(lái)源特征同樣為 one-hot 特征,但由于答案的來(lái)源有 50多種,導(dǎo)致數(shù)據(jù)非常稀疏,因此需要進(jìn)行特征壓縮,此處同樣使用了 embedding 學(xué)習(xí)方式,來(lái)表示答案來(lái)源特征。
模型預(yù)測(cè)層:分別嘗試了滿(mǎn)意度類(lèi)別預(yù)測(cè)和滿(mǎn)意度分布預(yù)測(cè),前者預(yù)測(cè)屬于分類(lèi)模型,后者屬于回歸模型。
4 會(huì)話(huà)滿(mǎn)意度預(yù)估實(shí)驗(yàn)結(jié)果 圖 11:用戶(hù)會(huì)話(huà)滿(mǎn)意度預(yù)估結(jié)果比較
實(shí)驗(yàn)結(jié)果如圖 11 中所示。從實(shí)驗(yàn)結(jié)果來(lái)看分類(lèi)模型滿(mǎn)意度預(yù)估效果較差,平均比實(shí)際用戶(hù)反饋高了 4 個(gè)百分點(diǎn)以上,回歸模型可以很好的擬合用戶(hù)反饋結(jié)果,而且減小了小樣本結(jié)果的震蕩,符合預(yù)期。如表 9 中所示,回歸模型的均值與用戶(hù)真實(shí)反饋的結(jié)果的差值僅為 0.007,而方差則比之前減小了三分之一,證明了回歸模型的有效性。 表 9:用戶(hù)會(huì)話(huà)滿(mǎn)意度預(yù)估結(jié)果比較
七 總結(jié)
本文總結(jié)了目前智能客服系統(tǒng)中情感分析能力的一些實(shí)際應(yīng)用場(chǎng)景以及相應(yīng)的模型介紹和效果展示。雖然情感分析能力已經(jīng)滲透到了智能客服系統(tǒng)人機(jī)對(duì)話(huà)過(guò)程的各個(gè)環(huán)節(jié)中,但是目前也只能算是一個(gè)良好嘗試的開(kāi)始,其在智能客服系統(tǒng)的類(lèi)人能力構(gòu)建進(jìn)程中還需要發(fā)揮更大的作用。
機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開(kāi)發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖 |