創(chuàng)澤機(jī)器人 |
CHUANGZE ROBOT |
站在新的一個(gè)十年,智能人機(jī)交互、多模態(tài)融合、結(jié)合領(lǐng)域需求的 NLP 解決方案建設(shè)、知識(shí)圖譜結(jié)合落地場(chǎng)景等將會(huì)有突破性變化。
1 智能人機(jī)交互
語言模型將在智能人機(jī)交互中扮演更重要的角色,形成更豐富的形式,混合 100 種語言的多語言語言模型,以及融合圖像-文本和語音-文本多模態(tài)語言模型將嶄露頭角,在不同語言、不同模態(tài)、不同領(lǐng)域的小樣本場(chǎng)景下帶來全面的能力提升。
多語言交互從不同語言理解上升到不同文化的理解,通過跨文化理解技術(shù)深入當(dāng)?shù)匚幕瘜?shí)現(xiàn)地道的對(duì)話交互。
以在線文本為核心的交互方式將全面轉(zhuǎn)變?yōu)榻Y(jié)合視頻、圖像、語音、文本的多模態(tài)人機(jī)交互。
基于數(shù)據(jù)驅(qū)動(dòng)的對(duì)話狀態(tài)跟蹤和對(duì)話策略將逐漸替代規(guī)則式策略,使得多輪對(duì)話技術(shù)進(jìn)一步演進(jìn),帶來更自然的對(duì)話體驗(yàn)。
知識(shí)圖譜將廣泛融入問答和對(duì)話的各類深度學(xué)習(xí)模型,通過先驗(yàn)知識(shí)及推理能力的融入,使得模型更為白盒化,在對(duì)話的理解和生成過程中帶來更好的可控性和可解釋性。
對(duì)話系統(tǒng)在小樣本情況下的冷啟動(dòng)能力提升帶來應(yīng)用構(gòu)建成本的大幅下降,對(duì)話系統(tǒng)從主要為大體量的客戶服務(wù),拓展為更普惠的、廣泛的支持海量規(guī)模、各行業(yè)的小企業(yè)及小商家,并進(jìn)一步走向海外,使得更多不同國(guó)家、不同語言和不同文化的用戶進(jìn)入智能服務(wù)時(shí)代。
2 多模態(tài)融合
隨著 5G 和邊緣計(jì)算的逐步成熟和普及,將帶來視頻、圖像、文本、語音等模態(tài)的全面融合,語言模型朝著多模態(tài)融合的方向發(fā)展,在在線場(chǎng)景下實(shí)現(xiàn)混合模態(tài)的理解,將能融合理解用戶經(jīng)過多輪對(duì)話發(fā)送的圖片、語音和文字內(nèi)容,并以多模態(tài)的形式進(jìn)行回復(fù);
對(duì)話系統(tǒng)產(chǎn)品中將全面實(shí)現(xiàn)多模態(tài)交互能力,直播和 IOT 大屏交互將全面應(yīng)用視頻+圖像+文本多模態(tài)技術(shù)帶來豐富的交互體驗(yàn),流暢的全雙工語音對(duì)話機(jī)器人將被普遍應(yīng)用,實(shí)現(xiàn)邊聽邊想、邊聽邊猜、主動(dòng)搶話等類人交互能力。
在語音交互場(chǎng)景下通過聲學(xué)信號(hào)+文字信號(hào),識(shí)別用戶交流中的情緒變化, 在 IOT 互動(dòng)場(chǎng)景下實(shí)現(xiàn)基于攝像頭、麥克風(fēng)的擬態(tài)生命;
3 結(jié)合領(lǐng)域需求的NLP解決方案建設(shè)
過去 NLP 算法多以平臺(tái)/API 的方式輸出通用模型,相應(yīng)地也在各種云上建立了通用 NLP 算法平臺(tái)(Amazon Comprehend,微軟 Azure Text Analytics,谷歌云 Natural Language,阿里 NLP,百度 NLP 等)。
但是在業(yè)務(wù)場(chǎng)景中,每種場(chǎng)景領(lǐng)域都有自己的特定的需求,產(chǎn)生了相應(yīng)的場(chǎng)景數(shù)據(jù)。通用模型結(jié)合場(chǎng)景數(shù)據(jù)進(jìn)行領(lǐng)域自適應(yīng)訓(xùn)練,從而輸出的領(lǐng)域定制模型會(huì)更好地滿足業(yè)務(wù)需求。
4 知識(shí)圖譜結(jié)合落地場(chǎng)景
面向新的一個(gè)十年,通過 NLP 和知識(shí)圖譜兩大核心技術(shù)來構(gòu)建行業(yè)知識(shí)圖譜,機(jī)器能夠通過知識(shí)圖譜挖掘隱性關(guān)系,洞察“肉眼”無法發(fā)現(xiàn)的關(guān)系和邏輯,用于最終的業(yè)務(wù)決策,實(shí)現(xiàn)更深層次的業(yè)務(wù)場(chǎng)景落地。從發(fā)展方向來說,可以分為下面幾個(gè)方面:
優(yōu)化知識(shí)抽取能力:結(jié)合已有的知識(shí)和 NLP 技術(shù)能力進(jìn)一步提高非結(jié)構(gòu)化數(shù)據(jù)理解能力,應(yīng)用預(yù)訓(xùn)練語言模型、信息抽取、實(shí)體鏈接等相關(guān)的技術(shù),對(duì)非結(jié)構(gòu)化及半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行抽取和轉(zhuǎn)換,形成知識(shí)圖譜形式的知識(shí),以及和知識(shí)圖譜里面的結(jié)構(gòu)化的知識(shí)進(jìn)行鏈接。
與行業(yè)知識(shí)沉淀:在行業(yè)知識(shí)圖譜解決方案實(shí)際的落地過程中,面臨重重挑戰(zhàn),行業(yè)知識(shí)圖譜的構(gòu)建,本身就需要數(shù)據(jù)積累和基于業(yè)務(wù)場(chǎng)景的數(shù)據(jù)理解,而構(gòu)建和積累行業(yè)知識(shí)圖譜,將是認(rèn)知智能時(shí)代的核心競(jìng)爭(zhēng)力。在行業(yè)數(shù)據(jù)構(gòu)建時(shí),對(duì)知識(shí)的準(zhǔn)確性要求非常高,實(shí)體通常需要較多且具有行業(yè)意義。需要針對(duì)多源異構(gòu)數(shù)據(jù)融合,基于可動(dòng)態(tài)變化的“概念—實(shí)體—屬性—關(guān)系”數(shù)據(jù)模型,對(duì)各種類型的數(shù)據(jù)進(jìn)行抽象建模。
智能可信的知識(shí)推理:基于過去已知知識(shí)進(jìn)行知識(shí)推理,理解行業(yè)事件知識(shí)驅(qū)動(dòng)知識(shí)推理傳導(dǎo),利用行業(yè)規(guī)則邏輯結(jié)合深度模型進(jìn)行推理,使其能夠在業(yè)務(wù)的推理和輔助決策上帶來更加智能化的體驗(yàn)。
以上是我們對(duì)于 NLP 技術(shù)過去一年發(fā)展的回顧和今年趨勢(shì)的思考。一家之言難免疏漏或者以偏概全。拋磚引玉,希望能夠得到更多同學(xué)們的思考和指正。比爾·蓋茨曾說過,“語言理解是 人工智能 皇冠上的明珠”。要達(dá)到這樣的高度,還需要技術(shù)和應(yīng)用上的突破發(fā)展期待在下一個(gè)十年的開始,我們一起讓 NLP 技術(shù)發(fā)展更加迅速,應(yīng)用場(chǎng)景更加豐富,推動(dòng)認(rèn)知智能的發(fā)展更進(jìn)一步。
機(jī)器人招商 Disinfection Robot 機(jī)器人公司 機(jī)器人應(yīng)用 智能醫(yī)療 物聯(lián)網(wǎng) 機(jī)器人排名 機(jī)器人企業(yè) 機(jī)器人政策 教育機(jī)器人 迎賓機(jī)器人 機(jī)器人開發(fā) 獨(dú)角獸 消毒機(jī)器人品牌 消毒機(jī)器人 合理用藥 地圖 |