
目的
通過Kaggle的HR數(shù)據(jù)集分析身邊的小伙伴們?yōu)槭裁匆x職,并基于數(shù)據(jù)集中的特征制定一個(gè)評(píng)分卡模型來預(yù)測(cè)會(huì)不會(huì)離職。
數(shù)據(jù)集解釋
總覽:該HR數(shù)據(jù)集收集了15000份數(shù)據(jù),其中3571人離職,離職率23.8%。
satisfaction_level :對(duì)公司的滿意程度
last_evaluation :對(duì)公司的評(píng)價(jià)
number_project :做過項(xiàng)目的數(shù)量
average_montly_hours :每月工作時(shí)長(zhǎng)
time_spend_company :每天在公司的時(shí)間
Work_accident :工作差錯(cuò)
promotion_last_5years :五年內(nèi)有沒有提升
sales :職業(yè)
salary :薪資
left :是否離職
單變量分析
1. 工作差錯(cuò)
零差錯(cuò)員工離職率高于有差錯(cuò)員工;
職場(chǎng)上大部分人(85.54%)沒有發(fā)生過工作差錯(cuò)。從側(cè)面可以推斷,零差錯(cuò)員工相對(duì)工作能力強(qiáng),因此這部分人遇到能力與薪資不匹配的境遇更多,導(dǎo)致跳槽幾率升高。
2. 每月有效工作時(shí)長(zhǎng)
工作時(shí)長(zhǎng)介于163~200 h/month 的員工離職率低。以每月22個(gè)工作日計(jì)算,每日上班時(shí)長(zhǎng)在7.4~9.1小時(shí)的員工離職率相對(duì)較低(不知道那些“996”的老板們是否看過這個(gè)數(shù)據(jù))。因此,工作時(shí)間過長(zhǎng)或過短,都有可能造成員工離職。
3. 離職前對(duì)公司的評(píng)價(jià)
對(duì)公司評(píng)價(jià)中上(0.6-0.78)員工的離職率遠(yuǎn)遠(yuǎn)低于對(duì)公司評(píng)價(jià)很高或很低的員工。那些對(duì)公司評(píng)價(jià)很高卻又離職的人,對(duì)公司的評(píng)價(jià)或許有言不由衷的成分吧,畢竟說自己老東家壞話的員工在哪里都不受歡迎。
4. 參與項(xiàng)目數(shù)量
參與項(xiàng)目數(shù)量為3到4個(gè)項(xiàng)目的人離職意愿非常低;
只參與2個(gè)項(xiàng)目及以下的員工則相對(duì)非常想離職。這也很好理解,到現(xiàn)在才做過兩個(gè)項(xiàng)目,要么是受排擠,要么是能力不被認(rèn)可,還是跳槽迎接新挑戰(zhàn)吧;
參與5個(gè)及以上項(xiàng)目的人也想離職意向也偏高。或許是因?yàn)樽鲞^這么多項(xiàng)目了,應(yīng)該是老員工,很多企業(yè)中,老員工能力增長(zhǎng)的比薪資快很多,此處不留爺,自有留爺處!
5. 五年內(nèi)有沒有提升
結(jié)果情理之中,意料之內(nèi),五年都沒提升,肯定想離職!
6. 對(duì)公司的滿意程度
先說一個(gè)非常智障的結(jié)果,對(duì)公司評(píng)價(jià)滿分的1362個(gè)人中,無一人離職。對(duì)公司評(píng)價(jià)接近于零分的人中,離職率很高;
對(duì)公司評(píng)價(jià)中上(0.5-0.72)的員工離職率很低;
對(duì)公司評(píng)價(jià)很高的員工離職率也不低。我認(rèn)為有兩點(diǎn)原因,第一,這些人有些事真認(rèn)為公司很好,他們是被迫離職,不是主動(dòng)離職;第二,這部分人有些人十分隱忍謹(jǐn)慎,雖然對(duì)公司不滿,雖然是匿名填寫,他們還是不敢吐露真言。
7. 每天在公司的時(shí)間
每天只在公司待兩個(gè)小時(shí)的不愿意離職,這部分人要么是高管,要么是尸位素餐,所以不愿意離職;
在公司待五個(gè)小時(shí)的員工離職率很高,這部分人應(yīng)該是銷售員或者是體力勞動(dòng)者,他們?cè)诠拘枰ぷ魑逍r(shí),在外面可能還要工作5小時(shí)。
8. 薪資
這樣的結(jié)論真的是太不意外了,工資低當(dāng)然想跳槽了。
9. 職業(yè)
令人很意外的是,HR這個(gè)職業(yè)離職率高于其他職業(yè),可能是,哪個(gè)公司都需要HR吧;
management的離職率則相對(duì)偏低,可能是因?yàn)檫@部分人已經(jīng)在某一領(lǐng)域具備了一定專業(yè)水平和業(yè)務(wù)能力,因而在公司發(fā)展空間相對(duì)可預(yù)見。
決策樹
對(duì)離職率影響最大的因素是員工對(duì)公司的評(píng)價(jià)和每天在公司的時(shí)間。
評(píng)分卡模型
用邏輯回歸對(duì)各個(gè)特征的woe值進(jìn)行逐步回歸可得到評(píng)分卡模型(建模代碼太長(zhǎng),不一一貼出了)
注:得分越低,離職概率越大
總結(jié)
對(duì)離職率影響最大的因素是員工對(duì)公司的評(píng)價(jià)和每天在公司的時(shí)間;
HR可根據(jù)評(píng)分卡為公司職員做一次問卷調(diào)查,最后通過計(jì)算評(píng)分知曉各職員的離職意愿;
雖然很難改變員工對(duì)公司的評(píng)價(jià),但是CEO可酌情給員工更多的辦公自由來減少離職率。