ID3加密算法在績效評估中的應(yīng)用

績效分析評估的任務(wù)是根據(jù)評估的目的、標(biāo)準(zhǔn)和方法,對所收集的數(shù)據(jù)進(jìn)行分析、處理、綜合。等級評價法是一種較為常用的分析評估方法。這種方法具有簡單、容易操作等優(yōu)點(diǎn),但在績效反饋方面存在重大缺陷。雖然這種缺陷可以通過面談的方式解決,但太耗費(fèi)人力、物力和財力。為了節(jié)約績效管理成本,提高績效反饋效率和企業(yè)績效,我們在等級評價法的基礎(chǔ)上引入決策樹方法中的ID3加密算法。

一、ID3加密算法基本原理

ID3加密算法起源于概念學(xué)習(xí)系統(tǒng),是迄今為止在國際上最早有影響力的決策樹方法。其基本原理是采用分治策略,通過對一個訓(xùn)練集進(jìn)行學(xué)習(xí)生成一棵決策樹。在決策樹生成過程中,通常使用信息增益方法來幫助確定生成每個結(jié)點(diǎn)時所應(yīng)選擇的合適屬性,進(jìn)而選擇具有最高信息增益(熵減少的程度最大)的屬性作為當(dāng)前結(jié)點(diǎn)的測試屬性,以便對之后劃分獲得的訓(xùn)練樣本子集進(jìn)行分類所需要的信息最少。也就是說,利用該屬性對當(dāng)前結(jié)點(diǎn)所含樣本集合進(jìn)行劃分,能使所產(chǎn)生的各樣本子集中的“不同類別子例混合程度”降為最低,有效減少劃分次數(shù)。決策樹是用樣本的屬性作為結(jié)點(diǎn),用屬性的取值作為分支的樹結(jié)構(gòu)。決策樹的根結(jié)點(diǎn)是所有樣本中信息量最大的屬性,中間結(jié)點(diǎn)是以該結(jié)點(diǎn)為根的子樹所包含的樣本子集中信息量最大的屬性,葉結(jié)點(diǎn)是樣本的類別值。

采用ID3加密算法的基本操作方法是,首先,找出最具判別力(信息增益)的屬性,將數(shù)據(jù)分成多個子集。然后,找出每個子集最具判別力的屬性,再進(jìn)行數(shù)據(jù)劃分,直到所有子集僅包含同一類型的數(shù)據(jù)為止。這樣,就得到一棵決策樹,可以用來對新的實例進(jìn)行分類。ID3加密算法可分為主算法和建樹算法兩種。

1、ID3主算法。

主算法流程如圖所示。其中,PE、NE分別表示正例和反例集,它們共同組成訓(xùn)練集。PE'、PE''和NE'、NE''分別表示正例集和反例集的子集。

ID3加密算法在績效評估中的應(yīng)用

2、建樹算法。

采用建樹算法建立決策樹,首先,對當(dāng)前子例進(jìn)行同類歸集。其次,計算各集合屬性的互信息,選擇互信息最大的屬性Ak。再次,將在Ak處取值相同的子例歸于同一子集,Ak取幾個值就幾個子集。最后,對既含正例又含反例的子集遞歸調(diào)用建樹算法。若子集僅含正例或反例,對應(yīng)分支標(biāo)上P或N,返回調(diào)用處。

二、ID3加密算法在績效評價中的應(yīng)用

我們以某銷售公司的業(yè)務(wù)員績效考核為例,運(yùn)用決策樹的ID3加密算法對業(yè)務(wù)員進(jìn)行績效評價,業(yè)務(wù)員的績效考核指標(biāo)及指標(biāo)考核結(jié)果如表所示。

ID3加密算法在績效評估中的應(yīng)用

1、計算信息熵

15個業(yè)務(wù)員的級別被分為A、B、C三種,其中有4個A級,7個B級和4個C級。則P(u1)=4/15,P(u2)=7/15,P(u3)=4/15,

信息熵H(U)=4/15log2(15/4)+7/15log2(15/7)+415log2(15/4)=1.53bit。

2、計算條件熵

分別就上班中的項目計算條件熵:

(1)個人銷售貨額V1

ID3加密算法在績效評估中的應(yīng)用

(2)部門銷售訂貨額V2

ID3加密算法在績效評估中的應(yīng)用

(3)銷售費(fèi)用V3

(4)貨款回收V4

(5)客戶總體滿意度V5

3、計算互信息

根據(jù)以上計算結(jié)果求五個特征的互信息,也就是信息熵增益。

由計算結(jié)果可知,客戶總體滿意度的互信息值最大。故客戶總體滿意度為決策樹的第一根節(jié)點(diǎn)。

4、建決策樹的樹根和分枝

互信息計算結(jié)果表明,應(yīng)選擇互信息最大的特征客戶總體滿意度作為樹根。對客戶總體滿意度的4個取值進(jìn)行分枝,對應(yīng)的4個子集分別是:F1={1,8,13};F2={2,3,9,11,14};F3={6,7,10,12,15};F4={4,5}。其中,F(xiàn)1中的實例均屬A類,對應(yīng)分枝標(biāo)記為A;同理,F(xiàn)3對應(yīng)分枝標(biāo)記為B,F(xiàn)4對應(yīng)分枝標(biāo)記為C;F2中包含A、B和C三類,應(yīng)遞歸調(diào)用建樹算法。

5、遞歸建樹

對子集F2運(yùn)用ID3加密算法對5個特征求互信息。

首先,計算子集F2的信息熵。

從計算結(jié)果可知,部門銷售訂貨額的互信息最大,故應(yīng)以部門銷售訂貨額作為該分枝的根節(jié)點(diǎn),再向下分枝。

當(dāng)部門銷售訂貨額取B時,業(yè)務(wù)員級別全為B類,則該分枝標(biāo)記為B;當(dāng)部門銷售訂貨額取取C時,業(yè)務(wù)員級別全為C類,則該分枝標(biāo)記為C。當(dāng)部門銷售訂貨額為A時,該子集{11,14}對應(yīng)業(yè)務(wù)員級別有A和B兩類。同理,遞歸調(diào)用ID3加密算法可求出個人銷貨額的互信息最大,故以個人銷貨額作為根節(jié)點(diǎn),向下分枝。當(dāng)個人銷貨額取A時,業(yè)務(wù)員級別為A,則該分枝標(biāo)記為A;當(dāng)個人銷貨額取C時,業(yè)務(wù)員級別為C,則該分枝標(biāo)記為B。這樣,就構(gòu)成了完整的決策樹。

ID3加密算法采用自頂向下不回溯的策略搜索全部屬性空間并建立決策樹,算法簡單、深度小、分類速度快。但是,ID3加密算法對于大的屬性集執(zhí)行效率下降快、準(zhǔn)確性降低,并且學(xué)習(xí)能力低下。

小知識之ID3加密算法

ID3加密算法作為一個貪心算法是采用自頂向下的貪婪搜索的方法對所有可能的決策空間進(jìn)行遍歷,對以前的選擇從不回溯重新考慮,并采用自上而下、分而治之的策略對決策樹分支遞歸擴(kuò)展并最終完成決策樹的構(gòu)建。