自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="3xvhv"></ruby>

<style id="3xvhv"></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

聊天機(jī)器人測(cè)試：對(duì)框架、工具和技術(shù)的深入了解

作者：李睿 2021-09-23 09:00:00

人工智能機(jī)器人

本文介紹了聊天機(jī)器人測(cè)試的概念，闡述了有關(guān)提高業(yè)務(wù)效率的正確框架、工具和技術(shù)等更多信息。

【51CTO.com快譯】多年來，推動(dòng)更好客戶體驗(yàn)的業(yè)務(wù)營(yíng)銷和實(shí)施技術(shù)的動(dòng)態(tài)發(fā)生了顯著變化。聊天機(jī)器人就是一個(gè)很好的例子。

如今，很多網(wǎng)站都會(huì)提供聊天機(jī)器人的虛擬幫助。更重要的是，聊天機(jī)器人幫助企業(yè)管理和擴(kuò)展他們的服務(wù)以及客戶關(guān)系管理(CRM)的實(shí)踐。

聊天機(jī)器人帶來的優(yōu)勢(shì)吸引了很多全球性企業(yè)的關(guān)注，他們致力發(fā)揮聊天機(jī)器人的全部潛力來實(shí)現(xiàn)他們的業(yè)務(wù)目標(biāo)。如果以正確的方式實(shí)施，聊天機(jī)器人可以幫助企業(yè)增強(qiáng)營(yíng)銷計(jì)劃，同時(shí)提供更廣泛的利益。

然而，正確地部署和使用聊天機(jī)器人不僅有助于實(shí)現(xiàn)企業(yè)的業(yè)務(wù)目標(biāo)，采用良好的聊天機(jī)器人測(cè)試策略還可以幫助企業(yè)推動(dòng)營(yíng)銷進(jìn)程。

以下將深入了解聊天機(jī)器人測(cè)試的框架、工具、技術(shù)等各方面的知識(shí)。

了解聊天機(jī)器人測(cè)試框架

當(dāng)人們談?wù)摿奶鞕C(jī)器人測(cè)試程序時(shí)，大多數(shù)都是一些標(biāo)準(zhǔn)化的要點(diǎn)。由于實(shí)現(xiàn)與通信相關(guān)的目標(biāo)可能會(huì)遇到挑戰(zhàn)，因此花費(fèi)時(shí)間了解測(cè)試用例可以幫助企業(yè)更快地啟動(dòng)聊天機(jī)器人。而測(cè)試策略的目標(biāo)是采用最受期待的測(cè)試實(shí)踐。因此，聊天機(jī)器人的測(cè)試框架大致分為三個(gè)主要部分：

預(yù)期場(chǎng)景
可能的場(chǎng)景
幾乎不可能的場(chǎng)景

而在這三個(gè)階段實(shí)施的測(cè)試程序通常涉及很高的投資，并且通常是為了加強(qiáng)一些語言方面的功能。

對(duì)聊天機(jī)器人測(cè)試的各個(gè)領(lǐng)域的簡(jiǎn)要介紹

當(dāng)開始進(jìn)行聊天機(jī)器人測(cè)試時(shí)，通常涉及以下類型的測(cè)試領(lǐng)域：

回答
對(duì)話流程
錯(cuò)誤管理
智能
自然語言處理(NLP)模型
導(dǎo)航
個(gè)性
響應(yīng)時(shí)間
速度
安全
理解

然而，從這些測(cè)試領(lǐng)域獲得最好的結(jié)果需要正確使用測(cè)試技術(shù)，這涉及敏捷和開發(fā)人員測(cè)試實(shí)踐。以下進(jìn)行簡(jiǎn)要介紹：

(1)敏捷和定期測(cè)試

聊天機(jī)器人都是關(guān)于敏捷技術(shù)的，因?yàn)樗兄谠诿看窝h(huán)后獲得所需的可行性。這種技術(shù)可以幫助處理錯(cuò)誤，并通過快速迭代防止錯(cuò)誤。其初始階段通常涉及人工測(cè)試程序，這些程序通常用于處理業(yè)務(wù)工作流，而最后階段通常是自動(dòng)化的，以防止浪費(fèi)時(shí)間，并快速推出市場(chǎng)。

(2)開發(fā)人員測(cè)試

這是一種更直接的測(cè)試方式，旨在通過預(yù)先定義用戶查詢問題的答案來驗(yàn)證測(cè)試。這種類型的測(cè)試很簡(jiǎn)單，通過檢查聊天機(jī)器人給出答案的準(zhǔn)確性來回答隨機(jī)問題。

聊天機(jī)器人測(cè)試的框架

定義聊天機(jī)器人的操作并非易事，因此需要分析能力來克服該功能的不確定性。有許多框架可用于聊天機(jī)器人測(cè)試，但在使用它們之前，測(cè)試人員有必要了解可用測(cè)試技術(shù)或框架的目的和好處，以便將它們與定義的目標(biāo)保持一致：

高級(jí)自動(dòng)化框架：測(cè)試端到端的對(duì)話流程，在理解自然語言的同時(shí)識(shí)別自我改進(jìn)的機(jī)會(huì)。
特定領(lǐng)域測(cè)試：評(píng)估所選服務(wù)的商業(yè)利益，以及滿足最終用戶目標(biāo)檢查可能的用例。
KPI分析和實(shí)時(shí)監(jiān)控：通過測(cè)量不同的KPI來測(cè)試聊天機(jī)器人的性能，例如完成率、人工智能和機(jī)器學(xué)習(xí)的學(xué)習(xí)率、回退率和自助服務(wù)率。
高級(jí)安全機(jī)制：評(píng)估端到端加密、合規(guī)性驗(yàn)證、身份驗(yàn)證超時(shí)、合并用戶身份驗(yàn)證、意圖授權(quán)、通道身份驗(yàn)證和自毀消息的安全機(jī)制。

聊天機(jī)器人測(cè)試的工具

由于聊天機(jī)器人測(cè)試需要為訪問網(wǎng)站的任何人提供令人愉悅的用戶體驗(yàn)，因此在各種領(lǐng)域和實(shí)踐中工作需要使用正確的工具。以下是一些可以考慮用于聊天機(jī)器人測(cè)試項(xiàng)目的優(yōu)秀的工具：

(1)Botanalytics

Botanalytics是一種支持人工智能的工具，它可以在獲取參與度的同時(shí)進(jìn)行對(duì)話分析。此工具用于增強(qiáng)A/B測(cè)試、通過情緒分析引導(dǎo)交互等功能。

(2)Chatbottest

Chatbottest是一個(gè)免費(fèi)工具，附帶120個(gè)問題來評(píng)估聊天機(jī)器人帶來的用戶體驗(yàn)。該工具適用于聊天機(jī)器人測(cè)試的所有上述定義的領(lǐng)域。

(3)Dimon

Dimon是一種可用于測(cè)試聊天機(jī)器人的對(duì)話流程以及用戶體驗(yàn)的工具。此外，該工具還可用于將聊天機(jī)器人與Facebook、Messenger等社交媒體平臺(tái)集成。

聊天機(jī)器人測(cè)試的技術(shù)

盡管可以選擇不同的測(cè)試技術(shù)來測(cè)試聊天機(jī)器人，但每種技術(shù)的選擇取決于企業(yè)使用的工具。這是一種在模型中獲取所有訓(xùn)練數(shù)據(jù)并預(yù)測(cè)模型的簡(jiǎn)單方法。聊天機(jī)器人測(cè)試技術(shù)分為兩大類：

(1)行業(yè)標(biāo)準(zhǔn)交叉驗(yàn)證

基于機(jī)器學(xué)習(xí)的模型通常使用統(tǒng)計(jì)方法進(jìn)行測(cè)試，稱之為交叉驗(yàn)證。這種測(cè)試技術(shù)的工作原理是評(píng)估模型預(yù)測(cè)與訓(xùn)練不同的新數(shù)據(jù)的能力。在交互式人工智能系統(tǒng)中進(jìn)行此類測(cè)試時(shí)，使用示例訓(xùn)練查詢測(cè)試機(jī)器人的范圍。

最基本的實(shí)踐包括LOOCV和K-fold方法，這意味著將數(shù)據(jù)分成k組，其中一部分用于測(cè)試模型，另一部分或K-1組用于訓(xùn)練目的。簡(jiǎn)而言之，此實(shí)踐適用于在每次拆分中進(jìn)行K次迭代的迭代。

另一方面，LOOCV方法是一種范圍更廣泛的技術(shù)，它適用于原始測(cè)試數(shù)據(jù)的可能組合，以進(jìn)行訓(xùn)練和測(cè)試。該技術(shù)涉及較少的計(jì)算測(cè)試，并且可以針對(duì)較小的數(shù)據(jù)集實(shí)施。這種測(cè)試最好在盲測(cè)之前使用。

(2)盲測(cè)

盲測(cè)技術(shù)通常是針對(duì)用戶可能用來獲得所需答案的問題進(jìn)行的。在大多數(shù)情況下，這些查詢是通過已經(jīng)定義的模型通過批測(cè)試執(zhí)行的，因?yàn)樗兄跇?biāo)記所有查詢并確保所有預(yù)測(cè)是否正確。

然而，對(duì)于使測(cè)試人員獲得特定結(jié)果的操作步驟，必須檢測(cè)使用的任何方法。通常情況下，實(shí)現(xiàn)數(shù)據(jù)可視化是為了理解不同模型之間的相似性和差異性。

自然語言處理(NLP)訓(xùn)練器也可以實(shí)施混淆矩陣來檢測(cè)模式，并重新訓(xùn)練最終目標(biāo)，但并非所有項(xiàng)目都需要通過這兩種技術(shù)進(jìn)行驗(yàn)證。此外，測(cè)試技術(shù)的選擇取決于測(cè)試服務(wù)提供商可用的知識(shí)、經(jīng)驗(yàn)和資源。

如何在沒有當(dāng)前數(shù)據(jù)的情況下創(chuàng)建完美的測(cè)試集?

交互式人工智能的測(cè)試和實(shí)施完全取決于所使用的數(shù)據(jù)集。因此，開發(fā)測(cè)試用例的人員可以遵循某些規(guī)則，以確保獲得最佳結(jié)果：

基于場(chǎng)景的測(cè)試集反映了訪問網(wǎng)站的用戶可能遇到的可能場(chǎng)景。這通常涉及基于意圖的問題。
詳細(xì)描述為用戶與聊天機(jī)器人交互提供解決方案，同時(shí)結(jié)合用戶類型、查詢表達(dá)式和難度。
以系統(tǒng)的順序排列問題和解釋。
為相應(yīng)的查詢提供措辭恰當(dāng)且有價(jià)值的解決方案。
擁有最好的數(shù)據(jù)源來實(shí)時(shí)回答用戶提出的問題。

1.必須避免的常見錯(cuò)誤

測(cè)試數(shù)據(jù)可以出現(xiàn)錯(cuò)誤，因此需要降低期望值。以下是一些必須避免的常見錯(cuò)誤：

在測(cè)試會(huì)話人工智能時(shí)，對(duì)導(dǎo)致任意問題的場(chǎng)景準(zhǔn)備不當(dāng)。
導(dǎo)致沖突或問題的相似表達(dá)的意圖差異。
僅包括一般的場(chǎng)景。
數(shù)據(jù)集缺乏清晰性，其中包含大量不需要的內(nèi)容。

2.必須考慮的常見聊天機(jī)器人測(cè)試場(chǎng)景

(1)聊天機(jī)器人應(yīng)該加載需要實(shí)現(xiàn)它的網(wǎng)站。

(2)當(dāng)用戶登陸網(wǎng)站時(shí)，聊天機(jī)器人應(yīng)該以彈出或聲音的方式清晰地加載。

(3)聊天機(jī)器人應(yīng)該根據(jù)用戶的時(shí)區(qū)適時(shí)地向他們打招呼。

(4)如果已經(jīng)注冊(cè)的用戶訪問該網(wǎng)站，聊天機(jī)器人應(yīng)該稱呼他們的姓名。

(5)聊天機(jī)器人應(yīng)該在聊天期間使用用戶的姓名回答查詢。

(6)如果需要，聊天機(jī)器人應(yīng)該詢問用戶的聯(lián)系方式。

(7)聊天機(jī)器人應(yīng)該很好地識(shí)別男性和女性用戶。

(8)聊天機(jī)器人應(yīng)該識(shí)別可能的拼寫錯(cuò)誤。

(9)聊天機(jī)器人應(yīng)該了解各國貨幣和數(shù)字。

(10)聊天機(jī)器人應(yīng)該驗(yàn)證編程格式的聯(lián)系人、日期和時(shí)間。

(11)聊天機(jī)器人應(yīng)該能夠處理由于復(fù)雜性引起的混亂。

(12)聊天機(jī)器人應(yīng)該能夠很好地響應(yīng)粘貼的基于文本的查詢。

(13)如果經(jīng)過訓(xùn)練，聊天機(jī)器人應(yīng)該存儲(chǔ)對(duì)話歷史，并將其轉(zhuǎn)發(fā)到存儲(chǔ)庫。

(14)聊天機(jī)器人應(yīng)該能夠很好地處理同時(shí)來自不同用戶的查詢。

結(jié)語

總之，這一切都?xì)w結(jié)為針對(duì)所需功能測(cè)試對(duì)話式人工智能，可以通過持續(xù)的努力和正確使用這些技術(shù)來增強(qiáng)這些功能。更重要的是，聊天機(jī)器人測(cè)試涉及聊天機(jī)器人生命周期的一些關(guān)鍵特征，這些特征只能通過聊天機(jī)器人測(cè)試技術(shù)和框架并使用正確的工具和其他實(shí)踐來實(shí)現(xiàn)，以防止錯(cuò)誤并確保正確運(yùn)行。

簡(jiǎn)而言之，聊天機(jī)器人的設(shè)計(jì)必須能夠在特定領(lǐng)域的測(cè)試中提供最大的交互性，而這些測(cè)試是通過分析每分鐘的測(cè)試結(jié)果來運(yùn)行的，這一點(diǎn)非常重要。這種做法不僅可以幫助企業(yè)很好地處理用戶查詢，還可以創(chuàng)建足夠智能的機(jī)器人程序來實(shí)現(xiàn)業(yè)務(wù)轉(zhuǎn)換。

因此，無論企業(yè)是進(jìn)行人工檢查還是使用一些高級(jí)自動(dòng)化測(cè)試工具來評(píng)估聊天機(jī)器人，創(chuàng)建能夠處理對(duì)話、理解匹配意圖并為用戶提供良好體驗(yàn)的聊天機(jī)器人，將是企業(yè)實(shí)現(xiàn)其營(yíng)銷、銷售和客戶服務(wù)戰(zhàn)略的關(guān)鍵所在。

原文標(biāo)題：Chatbot Testing: Deeper Insights to Framework, Tools and Techniques，作者：Hima Pujara

【51CTO譯稿，合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

責(zé)任編輯：華軒來源： 51CTO

機(jī)器人人工智能技術(shù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<cite id="ylsbv"><menuitem id="ylsbv"><pre id="ylsbv"></pre></menuitem></cite>

<sub id="ylsbv"></sub>

<blockquote id="ylsbv"><rt id="ylsbv"></rt></blockquote>