正確的設計可以使更多的數據科學見解(甚至是不完美的,概率性的見解)。
我們生活在機器學習時代。 這意味著我們所制造的產品越來越少地以事實為依據進行交易:相反,它們越來越依賴于推理,預測和推薦等概率性事物。 根據定義,這些事情具有不確定性。 不可避免地,它們將是錯誤的。
但這并不意味著它們沒有產品價值。 畢竟,您可能寧愿知道下雨的幾率是50%,而根本沒有天氣預報。 我們如何才能從錯誤的算法中釋放用戶價值? 我們可以做預測所要做的事情:設計產品時要先于不確定性。
在機器學習時代,設計能夠傳達確定性的產品可能會帶來巨大的競爭優勢:
· 它可以解鎖新的價值。 通過授權用戶就如何使用它們做出自己的判斷,而不是決定并什么都不做,我們可以產生并發送更多的數據科學見解-甚至是不完美的,概率性的見解。
· 它可以減少風險。 傳達不確定性是免責聲明:用戶可以權衡證據并得出結論的風險由自己承擔,而不必以產品的面值提出索賠,并使產品對不透明,錯誤的結論負責。
· 它可以提高可用性。 好的設計可以使用戶看到產品在做什么:系統狀態的可見性是Nielsen Norman進行用戶界面設計的第一種啟發式方法。 不確定性的可見性為用戶節省了自己弄清楚某事物的可靠性的痛苦。
這一切有問題嗎? 不確定性很難設計。 機器學習表示概率的不確定性,但是概率不是產品:普通人不想鉆研p值和置信區間,設計人員也不想創建充滿星號和技術知識的復雜怪獸。 此外,非專家不太擅長解釋原始概率,有時會將其轉變為可怕的戰略決策。
我們應該傳達產品中的不確定性,但是我們需要有效的,以用戶為中心的設計解決方案來做到這一點。 在本文中,我將介紹三種效果很好的設計模式:
· 展示你的作品
· 顯示單個數據點
· 讓用戶完成難題
為了具體起見,我主要從Context(我們的法律數據分析產品)中提取示例,該產品從數百萬司法意見的語言中提取有用的見解。 這是將機器學習產品化的絕佳平臺,因為我們的律師用戶群可以高度懷疑概率,完全不容忍錯誤。 我們在設計適用于他們的產品方面學到了很多東西!
設計模式1:展示您的作品
這里的公式很簡單:提供您的概率見解(現在機場有點繁忙...),并讓用戶知道您的算法是如何到達的(...基于對這個地方的訪問)。 Google Maps這樣做:
這可以使您的見解更具辯護性和實用性:用戶可以根據他們在方法論中看到的任何特定偏見或限制進行調整,并自己決定結論的信心。
在上下文中,我們的見解基于司法文件的書面語言。 下面,我們的語言算法發現了一位專業證人Giles博士和一家律師事務所Thompson&Knight有一個先前的聯系:他們過去似乎互相反對(在決定是否要 聘請Giles博士)。 我們的設計顯示了導致算法得出該結論的確切語言。 這可以幫助用戶驗證結論,并且可以進一步深入了解該專家和律師事務所如何相互了解:
在推薦引擎的世界中展示您的工作也很方便。 下面的設計以完整句子的形式進行:
這種設計從字面上告訴用戶該算法的工作原理:從本質上講,該算法只是吸引過去的客戶作為推薦者,這是一種稱為協作過濾的聰明技術。 通過完全透明,設計消除了滿足不確定的潛在期望的算法,例如推薦相似,相關或誘人的產品。
最后,有時展示您的作品可能會成為主要的吸引力。 在拉威爾法(Ravel Law),我們建立了一個實驗性動議結果預測器,該預測器可計算出法院將批準某項動議的機會百分比,并顯示出不同的因素(如主張的辯護類型)如何憑經驗或多或少地獲得授權。 我們通過簡單的可視化展示了因子權重:
我們向預報員展示的律師比對結果的精確預測要更感興趣的是了解這些單獨因素的作用-他們在起草議案時可以控制的可操作性。 預測是困難且不確定的,但是顯示我們(模型)的工作為我們的律師提供了有用的參考。
設計模式2:顯示單個數據點
如今,單個數據點很少,這似乎是遺物,許多設計重點在于如何以數據儀表板的形式將大量數據集抽象為人類可理解的概括。 但是泛化會給我們帶來麻煩,尤其是在數據稀疏的情況下。 矛盾的是,大數據意味著我們現在比以往擁有更多的小型數據集,將大數據切片和切塊的結果縮小到我們感興趣的范圍。我們應該針對小數據固有的不確定性進行設計。
此外,在大小數據集中,當數據實際上遵循與我們假設不同的分布時,匆忙下結論可能會帶來麻煩。 潛在的分布可能是偏斜的,雙峰的,甚至是相反的,如本例中的辛普森悖論所示:
對于產品而言,揭示單個原始數據點可能更安全(通常更有用),從而傳達其結論是否可靠的不確定性。 考慮一下我們的Context設計之一,它顯示了專家證人在法庭上成功取證的成功記錄:
最初的設計需要大量的"匯總統計數據",正如我們所說的那樣-多個條形圖斷定了專家在各種情況下的證詞接納率。 問題在于,許多專家只有一個或兩個結果,這不足以使這些圖表可靠地發揮作用。 我們本來會很笨拙地宣布,每個數據點都支持0%和100%的導納率,這在技術上不是錯誤的,但暗示著專家作證的方式過于確定。 取而代之的是,我們的最終設計將專家證言的每一個挑戰形象化,讓用戶發現模式并自行判斷他們應該如何對待它們。
設計模式3:讓用戶解決難題
機器學習可以做令人驚奇的事情-但它仍然不能解決所有問題,難題的某些部分最好交給人類。 一種算法可能擅長查找片段,但不確定整體解決方案。 我們的設計應為用戶安排這些作品,并自行設置完成拼圖。
當涉及人工智能尚未真正解決的高階問題(例如解釋因果關系)時,這種想法最為有趣。 我們的上下文用戶看到隨著時間的流逝,影響特定公司的訴訟數量激增,并想知道是什么導致了這些激增。 我們的設計在平行的時間軸上安排了法律案件和新聞報道群,邀請用戶自己推斷因果關系。 在這里,用戶可能會假設涉及Chipotle的法律案件激增可以由稍早一些有關Chipotle和E. coli的新聞頭條解釋:
這樣的問題-為什么會發生什么,接下來會發生什么,您應該怎么做-很難解決并且冒險做出明確的回答。 但是我們不必做任何事情,至少不是完全沒有做。 通過暗示性地排列算法確實找到的難題部分,產品設計可以激發用戶進行思考,充實和評估的想法,從而使人類處于循環中,以從不完善的機器學習中提取價值。
最后的想法
通過設計不確定性,我們可以解鎖全新的產品,在這些產品中,機器學習對于傳統設計可能不夠精確。 我提供了產品設計可以傳達不確定性的三種方式:展示他們的工作,揭示單個數據點以及讓用戶完成難題。 但是,隨著機器學習的發展,以及用戶對不確定性的更深入思考以及道德和法規要求透明性,我們揭示不確定性的設計解決方案范圍肯定會增加。 我期待看到我們的想法。
-
機器學習
+關注
關注
66文章
8434瀏覽量
132872
發布評論請先 登錄
相關推薦
評論