因子分析主要用于分析商戶O2O運(yùn)營數(shù)據(jù),了解商家的行為信息,找出數(shù)據(jù)背后的共性,最終對商家進(jìn)行綜合評價,挖掘商家特點。
應(yīng)用背景
獲得企業(yè)所屬的商戶O2O運(yùn)營數(shù)據(jù)后,通過分析它們在一段時間內(nèi)的線上線下行為信息,找出這些變量的共性,降低分析維度,對商戶進(jìn)行綜合評價,可以知道產(chǎn)品運(yùn)營效果是否達(dá)到預(yù)期。
分析方法
因子分析(探索結(jié)構(gòu),簡化數(shù)據(jù),綜合評價)
分析工具
SPSS(數(shù)據(jù)分析的重量級應(yīng)用,與SAS二選一)
實例:100個商戶的O2O運(yùn)營數(shù)據(jù)
因子分析的目的是什么?
探索結(jié)構(gòu):在變量之間存在高度相關(guān)性的時候,我們希望用較少的因子數(shù)目來概括其信息。
簡化數(shù)據(jù):把原始變量轉(zhuǎn)化為因子后,使用因子得分進(jìn)行分析,比如聚類分析、回歸分析等。
綜合評價:通過每個因子得分計算出綜合得分,對分析對象進(jìn)行綜合評價。
因子分析的步驟
判斷數(shù)據(jù)是否適合因子分析
構(gòu)造因子變量
利用銀子旋轉(zhuǎn)方法使得因子更有實際意義
計算每個個案的因子得分
如何判斷數(shù)據(jù)是否適合因子分析?
因子分析的變量要求為連續(xù)變量,分類變量不適合直接進(jìn)行因子分析。
建議個案個數(shù)為變量個數(shù)的5倍以上,這只是參考值,不是絕對標(biāo)準(zhǔn)。
KMO檢驗統(tǒng)計量:小于0.5時不適合因子分析;大于0.5小于0.7時,尚可以接受因子分析;大于0.7小于0.8時,比較適合因子分析;大于0.8時非常適合因子分析。
不瞎逼逼,直接開干。
【描述】
勾選“KOM和巴特利特球形度檢驗”,目的是用于生成檢驗因子分析適合度的統(tǒng)計指標(biāo)。
【提取】
方法選擇“主成分”,這是最常用的提取因子的方法;
勾選“碎石圖”,用于輔助判斷因子個數(shù)。
【旋轉(zhuǎn)】
選擇“最大方差法”,用于更好的解釋因子所包含的意義。
最大方差法師最常用的,該方法能夠使每個變量盡可能的在一個引子上有較高的載荷,在其余因子上載荷較低,從而方便對因子進(jìn)行解釋。
【得分】
勾選“保存為變量”,方法選擇“回歸”,用于保存計算的到的因子得分。
【選項】
勾選系數(shù)顯示格式中的“按大小排序”,是為了讓系數(shù)大小有序,方便觀察;勾選“排除小系數(shù)”,輸入0.4,這樣在結(jié)果中相關(guān)系數(shù)小于0.4的會被排除,不再顯示,也是為了方便觀察(因為我們是尋找相關(guān)系數(shù)高的)
注意:這里不必生搬硬套,也不必也定時0.4,可視具體情況而定
分析結(jié)果解讀:
該結(jié)果主要用來檢驗數(shù)據(jù)是否適合因子分析,主要參考KMO統(tǒng)計量即可。
KMO統(tǒng)計量為0.627,大于0.5小于0.7,尚可以接受因子分析。
這個結(jié)果是“變量共同度”,顯示了原始變量能被提取的因子解釋的程度。
本例中所有變量共同度都在60%以上,可以認(rèn)為所提取的因子對各變量的解釋能力是可以接受的。
該圖是“總方差解釋”,顯示了通過分析所提起的因子數(shù)量,以及所提取的因子對所有變量的累計方差貢獻(xiàn)率。
累計方差貢獻(xiàn)率大于60%,則說明因子對變量的解釋能力尚可接受,達(dá)到80%,說明因子對變量的解釋能力非常好。
本例根據(jù)“初始特征值”大于1的標(biāo)準(zhǔn)提取了兩個因子,旋轉(zhuǎn)之后累計方差貢獻(xiàn)率達(dá)到72.367%,因子的解釋能力較好。
碎石圖”能輔助我們判斷最佳因子個數(shù),通常是選區(qū)取現(xiàn)中比較陡峭的位置所對應(yīng)的因子個數(shù)。
本例前三個音字都在較陡峭的曲線上,所以提取2~~3個因子都可以對原始變量有較好的解釋。
如何確定提取的因子個數(shù)?
初始特征值(總方差解釋圖)大于1的因子個數(shù)
累計方差貢獻(xiàn)率(總方差解釋圖)達(dá)到一定水平的因子個數(shù)(如60%)
碎石圖中處于陡峭曲線上的對應(yīng)因子個數(shù)。
根據(jù)經(jīng)驗或研究,指定個數(shù)。
這是旋轉(zhuǎn)之前的因子載荷矩陣,難以對因子進(jìn)行明確定義,可以忽略不看,直接看旋轉(zhuǎn)后的因子載荷矩陣。
“旋轉(zhuǎn)后的成分矩陣”顯示的是旋轉(zhuǎn)后的因子載荷矩陣,這個結(jié)果能夠凸顯因子含義。
第一個因子:載荷較大的變量是“網(wǎng)店瀏覽量”、“論壇瀏覽量”、“線上廣告費(fèi)用”、“實體店訪客數(shù)”,說明這四個變量與該因子的相關(guān)程度較高,其中前三個是反映的是線上數(shù)據(jù),“實體店訪客數(shù)”放映的雖然是線下數(shù)據(jù),但是與第一個因子呈現(xiàn)反向關(guān)系。綜上所述可以吧第一個因子命名為“線上商務(wù)”。
第二個因子:載荷較大的是“實體店鋪貨數(shù)”、“線下廣告費(fèi)用”、“地面推廣引入量”,說明這個變量與因子的先關(guān)程度較高,并且反映的都是線下情況。綜上所述可以命名為“線下商務(wù)”。
注意:系數(shù)是按我們設(shè)置的降序排列,并且有的為空,是因為我們設(shè)置的排除小于0.4的系數(shù)是因子結(jié)果更加清晰,可讀。
這個圖沒什么卵用,忽略不計。
新生成了兩個變量就是每個商戶在兩個因子上的得分:第一個因子的得分,第二個因子的得分。
下面我們計算綜合得分。
公式:第一個因子占的加權(quán)比重數(shù)*第一個因子得分+第二個因子占的加權(quán)比重數(shù)*第二個因子得分
本例中旋轉(zhuǎn)后的方差解釋圖知:
因子1貢獻(xiàn)率為38.968%,因子2貢獻(xiàn)率為33.399,累積貢獻(xiàn)率為72.367
所以因子1占的加權(quán)比重數(shù)=38.968/72.367
因子2所占的加權(quán)比重數(shù)=33.399/72.367
對綜合得分進(jìn)行將序排列,就能知道哪些商戶在O2O的運(yùn)營方式下表現(xiàn)優(yōu)異。
知道了那些商家表現(xiàn)優(yōu)異,那些商戶表現(xiàn)比較差,就可以進(jìn)行后的詳細(xì)分析,以提升企業(yè)的商業(yè)價值,達(dá)到某些商業(yè)目的。
以上就是上海網(wǎng)站設(shè)計提供的內(nèi)容,如果想要了解關(guān)于科技公司網(wǎng)站設(shè)計案例及幾何與設(shè)計,可直接點擊查看