永洪深度分析模塊集成了復(fù)雜的統(tǒng)計(jì)算法和機(jī)器學(xué)習(xí)技術(shù),能夠從海量數(shù)據(jù)中,挖掘具有潛在價(jià)值的關(guān)系、模式和趨勢,構(gòu)建數(shù)據(jù)模型,做出預(yù)測分析,但其仍然需要數(shù)理統(tǒng)計(jì)和數(shù)據(jù)挖掘的基礎(chǔ)知識,使用門檻相對較高。
基于此,永洪BI推出了數(shù)據(jù)解釋組件,將AI深度分析的能力以可視化組件的形式展示出來,使其可以在任意的報(bào)告中使用AI的能力探索和挖掘數(shù)據(jù)之間的相關(guān)性。
接下來的文章中,我們將介紹數(shù)據(jù)解釋組件如何使用,以及是如何解釋數(shù)據(jù)的。
01功能入口
制作報(bào)告拖拽右側(cè)的組件面板的“小燈泡”到制作區(qū)域,綁定需要解釋分析的數(shù)據(jù)集的字段。
02功能介紹
分析(Analyze):將需要分析的字段放入其中,如天氣的好壞、股票的漲跌、用戶的評分、空氣的質(zhì)量等。
解釋依據(jù)(Explainby):將可能導(dǎo)致出現(xiàn)分析字段的值的因素放入其中,如溫度、濕度、地區(qū)、年齡、行業(yè)、日期、車流量等。
03關(guān)鍵因素
綁定分析和解釋依據(jù)之后,通過永洪BI的AI算法計(jì)算后,得到對分析字段的關(guān)鍵因素,其主要的場景是可以用來展示哪些解釋依據(jù)會影響所分析的指標(biāo),以及對比這些解釋依據(jù)的相對重要性。
01分析字段的選擇值:
分析字段的選擇值:在此示例中,所選的值為“Low”。
02選項(xiàng)卡:
在視圖之間進(jìn)行切換。“關(guān)鍵因素”顯示對所選分析字段影響較大的一些解釋依據(jù)。“最佳組合”顯示對所選分析字段影響較大的一些解釋依據(jù)的組合。
03關(guān)鍵因素的闡述:
幫助解釋左側(cè)分析結(jié)果的圖表。
04左側(cè)分析結(jié)果:
在此情況下,顯示關(guān)鍵影響因素列表。點(diǎn)擊其中一個(gè)關(guān)鍵因素后,出現(xiàn)右側(cè)分析結(jié)果。
05解釋依據(jù)的相對重要性闡述:
幫助解釋右側(cè)分析結(jié)果的圖表。
06右側(cè)分析結(jié)果:
在此情況下,顯示左側(cè)中已選中關(guān)鍵因素“組織里面的角色”的所有值。
07平均線:
除“consumer”(即選中的解釋依據(jù))以外,計(jì)算了“組織里面的角色”的所有可能值的平均值。因此該計(jì)算適用于所有藍(lán)色的值。它顯示了其他低分“組織里面的角色”的百分比。
本例中,平均來看,除“consumer”的其他組織里面的角色約有13%打了低分(虛線所示)。
看到這里,有的小伙伴可能還是不知道具體是如何計(jì)算的。
就以上文的例子進(jìn)行詳細(xì)解釋:此影響者的占比,即是consumer的計(jì)數(shù)占所有數(shù)據(jù)量的占比,141245/209503=67.42%,這是第5部分的數(shù)據(jù)量的占比的來源。
組織里面的角色:administrator的low的比例是3840/13852=27.72%,consumer的low的比例是42287/141245=29.93%,publisher的low的比例是5013/54406=9.21%,這些值即是柱圖的高度。
除“consumer”(即選中的解釋依據(jù))以外,計(jì)算了“組織里面的角色”的所有可能值的平均值,即是下表中(3840+5013)/68258=12.96%,約為13%,這即是平均線的值。
左側(cè)的倍數(shù)2.31x,是由29.93%/12.96%得到的。
以該示例總結(jié)一下關(guān)鍵因素,選擇以下情況影響客戶評分為Low,可以分析出,導(dǎo)致客戶評分為Low的因素從大到小主要有:
客戶的有效期大于58個(gè)月、組織里面的角色是consumer、客戶關(guān)注的主題是可用性、安全性、訂閱類型是高級用戶、國家地區(qū)是法國,這些因素會使得客戶評分為Low的可能性增加。
如果對其中的某一個(gè)因素感興趣,可以繼續(xù)點(diǎn)擊關(guān)鍵因素排名,右側(cè)會展示此因素的詳細(xì)解釋,上方的文本展示了此因素的數(shù)據(jù)量占整個(gè)數(shù)據(jù)的百分比。
例如點(diǎn)擊組織中的角色是consumer,上方的文本展示了角色為consumer的客戶評分大概有67.42%的數(shù)據(jù),下方的圖表展示了各個(gè)角色在導(dǎo)致低評級上的影響的比較分析。
評價(jià)來看,13%的所有角色給出了Low的評分,30%的consumer給出了Low,與其他的客戶角色相比,consumer給出低分的可能性高出2.31倍。
04最佳組合
使用“關(guān)鍵因素”選項(xiàng)卡分別評估每個(gè)解釋依據(jù),切換選項(xiàng)卡后使用“最佳組合”選項(xiàng)卡查看解釋依據(jù)的組合,如何影響正在分析的指標(biāo)。
01分析字段的選擇值:
在此示例中,所選的值為銷售額的“提高”。
02選項(xiàng)卡:
在視圖之間進(jìn)行切換。“關(guān)鍵因素”顯示對所選分析字段影響較大的一些解釋依據(jù)。“最佳組合”顯示對所選分析字段影響較大的一些解釋依據(jù)的組合。
03最佳組合的分析結(jié)果:
在此情況下,顯示最佳組合列表。點(diǎn)擊其中一個(gè)最佳組合后,出現(xiàn)下側(cè)和右側(cè)分析結(jié)果。
04下側(cè)分析結(jié)果:
點(diǎn)擊其中一個(gè)最佳組合后,出現(xiàn)最佳組合的詳細(xì)信息,在此示例中,組合2的詳細(xì)信息為“邊際利潤大于114.50且利潤小于等于337”。
05右側(cè)分析結(jié)果:
在此情況下,顯示左側(cè)中已選中組合2中數(shù)據(jù)的平均值和整體中的平均值,并顯示對比。
06最佳組合右下分析結(jié)果:
以環(huán)形圖顯示組合2中的詳細(xì)數(shù)據(jù)量的占比。
以該示例總結(jié)一下最佳組合,影響銷售額提高的因素的組合有:組合1~組合7,組合2中“邊際利潤大于114.50且利潤小于等于337”的銷售額的平均值為347.61,整體的銷售額的平均值為192.99,在組合2中,包含了1236個(gè)數(shù)據(jù)點(diǎn),占比29.1%。
注:
關(guān)鍵因素的數(shù)據(jù)集來源于[Moroet al., 2014] S. Moro, P. Cortez 和P.Rita. “一種預(yù)測銀行電話營銷成功的數(shù)據(jù)驅(qū)動方法。”DecisionSupport Systems, Elsevier, 62:22-31, June 2014。
最佳組合的數(shù)據(jù)集為永洪BI自帶的咖啡中國市場銷售數(shù)據(jù)。
? ? ? ?ymf
評論
查看更多