用好大數據 民航需找到發力點
2015年06月15日
隨著大數據時代的到來,民航業紛紛開始尋求與大數據的結合點,亟待用好大數據創造盈利點。然而在運用大數據的過程中,還需要格外注意數據收集、整合與分析過程中的科學性,確保得到的結論真正具有現實意義和操作價值。
網上有新聞稱,基於攜程的大數據,分析得出購買航班延誤險種人群的結論:超過6成是男性,年齡集中在30歲~50歲,其中,商務旅客是購險的主力軍,進出北上廣深等地的投保人,占比接近40%。這樣的數據包含了若干人口學要素,然而這樣的數據呈現是否真的具有分析意義,能得出何種有價值的結論令筆者疑惑。
大數據之大,不僅是其中包含的樣本數量多,數據層次豐富,更在於數據間的彼此聯繫使得人們更容易繪製出一幅呈現事物內在本質的圖譜。購買延誤險的性別占比,男性為六成,我們可能得到"男性比女性更傾向於購買延誤險"的結論,然而我們不了解作者的數據來源,是不是把男性乘客和女性乘客分開計算的,也就是說如果男女乘客人數不是1:1,那麼購買延誤險的男性乘客超六成這個說法就不嚴謹。
此外,對於北上廣深旅客人次多,這是已經得到的結論,並無再次統計的必要性,由於旅客分佈的結構性差異,任何一個與旅行消費的統計大概都會得到北上廣深旅客數據占優的結論,而這樣又能說明什麼呢?此外,採用什麼方法獲知數據也影響著結論的價值,例如攜程得到的數據能否全面覆蓋,提取的這段時間數據樣本有沒有代表性,如果延遲險購買者的年齡分佈與網路使用偏好有關,那它的可信度就只在一定範圍內有效。如果民航對於核心數據的分析能力只停留在計算比值這一步,那大數據的作用還遠遠未觸及。
大數據表面看是數字,實則包含一種科學的態度,包括採集數據、分析數據和推導結論,都需要做到足夠的嚴謹,如果前提預設和數據收集不能很好地反應全面客觀的實際情況,那得到的結論可能會有偏差,很難對民航業產生積極的作用。
大數據時代,掌握數據源和分析方法同等重要,作為與資金、用戶數據密切相關的民航業,數據收集也相對便利客觀,因此利用好大數據是民航尋找經濟著力點的有效"利器",做好大數據分析需要專業的統計學、社會學專家來完成,然而科學嚴謹的分析方法,謹慎的結論推導都必須經過專業化的訓練,這正是民航面對大數據這塊獨有蛋糕時候,應當學會的正確切割方法。(馮帆)
新聞來源:中國民航報