民航大數據科普:大數據與快數據
2016年05月10日
當下最流行的技術詞匯可以概括為"雲物移大智",即雲計算、物聯網、移動互聯網、大數據和智慧城市。"大數據"在其中占據著重要的地位,民航業是旅遊行業中信息化水平比較高的,大數據的應用更是首當其沖。如何用好大數據,是民航運輸鏈條上每個企業必須要回答的問題。
一、數據的生命周期
大數據首先是數據,既然是數據,那麼從數據產生那一刻起,數據就有其生命周期。
數據根據其屬性不同,實時價值耗散曲線也不相同。如上圖所示,金融交易類的數據,其價值以毫秒計算,如股指期貨的指數數據,其價值瞬間就耗散,幾分鐘之前的股指數據幾乎沒有任何價值。航班的庫存(剩餘座位)信息,隨著機票銷售的進行,剩餘數量在不斷變化中,可能20秒之前的剩餘座位數據對現在已經不具備參考意義。天氣預報、實時路況和機票價格數據,其有效時間可能會稍長一些,以小時計算。2、3個小時之前的路況擁堵信息,已經不能作為人們出行的參考依據了。還有一些數據有效性可能會更長一些,比如商品房的售價,汽車的零售價,商家報給消費者的價格,有效期會是幾天的時間。
很多數據首先是快數據,其次才是大數據。那麼就需要正確認識數據的生命周期,充分利用數據的實時價值,比如機票的價格數據,需要根據庫存情況進行以小時為單位的動態調整。航班起飛後,這架航班上的機票銷售數據就成為曆史數據,實時價值喪失,這時候可以作為大數據的一部分,成為未來機票價格制定的參考依據。
二、快數據與大數據的互補
《大數據時代》幾乎是大數據的起航號角,毫無疑問的成為暢銷書,可以說在大數據行業幾乎人手必備。在《大數據時代》開篇列舉大數據的第一個案例就是Farecast的故事。美國著名的計算機專家發現航空公司機票價格制定比較混亂,不是越早買越便宜。於是就收集互聯網上廣泛存在的與機票價格有關的數據,在多達12000個價格樣本的基礎上,預測未來40天機票價格可能走勢。然後通過不斷調優,票價預測的准確度已經高達75%。作者通過這個例子想說明,大數據強調對於大量數據的處理,從而得出事物的相關性(機票價格的走勢),而不是因果性(機票價格為什麼降低)。
但現實是,作者關於Farecast的故事只講了一半。Farecast於2009年被微軟Bing搜索以1.15億美元收購,整合為Bing Travel的一個功能。在2014年4月,Bing宣布關閉Farecast的機票價格預測功能。在大數據存儲能力和處理能力越來越強大的今天,為什麼Farecast反而停止運行了呢?原因不是Farecast出了問題,而是航空公司對於自身數據的充分利用,讓Farecast的預測變得沒有意義。歐美全服務航空公司過去普遍應用收益管理系統(Revenue Management System)來制定銷售策略,但由於收益管理系統的數據輸入都是曆史數據,然後依靠數學算法進行模擬及預測,給出待售航班的銷售策略。由於多種原因,收益管理系統一直都是離線處理,航空公司很少根據實時銷售數據進行動態調整。隨著IT技術的進步,航空公司不僅可以根據實時銷售情況進行調整,而且還會綜合分析已經購票乘客的行程,向旅客推薦複雜行程的購買建議(在哪裏轉機比較優惠)。
航空公司不僅根據曆史數據進行收益管理,同時利用快數據進行動態調優,使得自身的價格策略滿足了不同層次和不同類型的消費者的需要。所以作為單個出行的旅客,使用Farecast進行機票價格預測其意義已經不大了。這可能是Farecast功能關閉的主要原因,也是快數據與大數據互補的結果。
三、大數據關鍵詞:跨界、後驗、預測
大數據首先強調跨界。對於民航業來說,就是不僅僅拘泥於自身運行產生的數據,而是要多方合作,獲取不同行業的數據進行相互補充和相互印證。比如,2014年11月是傳統意義上航空淡季,但由於北京舉辦APEC會議而意外獲得一個假期。這在任何收益管理系統中都是無法根據曆史經驗進行預測的,如果是大數據模式,則可以通過對網絡新聞的輿情監控獲知這一新聞熱點,同時根據北京市民通過搜索引擎對於旅遊目的地的瀏覽信息增多,尋找出熱點旅遊城市,進行有針對性的航班編排,提高主要目的地機票售價。這樣不僅滿足了人們的假期出行需要,而且還能獲得良好的收益。
其次大數據往往體現出後驗效應。由於大數據獲取的是多個領域產生的曆史數據,對於曆史數據的整理與分析,可以驗證各種情況發生因素。例如,對一個知名景區來說,可以根據移動運營商的服務的手機數量,結合景區監控視頻自動分析,門票售賣情況,以及周邊道路擁堵情況等多種信息,將這些信息綜合為大數據樣本,結合景區高峰時段接待人數和參觀體驗,可以梳理出一個模型,當景區承載量達到多少的時候,旅遊體驗開始下降,當周邊的道路擁堵距離多長的時候,景區就要采取預備的限流措施等等。這些都是根據多方數據進行後驗分析的結果。
最後,大數據最重要的功能就是預測。如上圖所示,對於乘機旅客行為的分析,可以看出國內旅客乘機人數增長較快,同時乘機頻次在下降,平均飛行距離在上升。這就說明,我國居民乘飛機出行越來越向普通人群擴散,根據年齡分布可以看出,商務旅客以男性為主,而年輕女性的乘機出行比例高於同年齡段男性。如果航空公司結合跨界的一些社區數據(如女性購物交流社區、驢友交流社區),就可以針對家庭中主要負責旅遊決策的女性設計實用的組合產品,針對年輕時尚的女性設計個性化的旅遊套餐,針對商務旅客的男性推廣便捷租車等商務綜合服務。
四、大數據思維與大數據應用
用戶需要的是五毫米的鑽孔,但很不幸他需要購買一個電鑽。在大數據領域,航空公司面對的要麼是大數據概念的宣貫,要麼是大數據的技術講解,如Hadoop、NoSQL。而筆者理解真正的大數據服務模式,就類似於民航的飛機,造飛機的廠商是少數,他們真正掌握飛機的設計原理和技術細節,開飛機的飛行員掌握駕馭飛機的技術,而乘客則只要知道坐飛機可以快速安全便捷的到達目的地就可以了。
未來真正掌握大數據技術的是少數的企業,它們提供大數據的基礎設施,應用大數據的企業,不需要自建成本高昂的大數據儲存和處理能力。作為航空公司,要想用好大數據,既不是著急去學習大數據的Hadoop技術,也不是去購置大數據硬件,而是要普及大數據思維,掌握大數據應用的本領。
所謂大數據思維,就是要認識到不同屬性數據的價值,將數據的實時價值用足用好,當數據實時價值降低的時候,作為曆史數據就可以成為大數據的重要數據源。不拘泥於本企業,本行業產生的數據,而是要圍繞著旅客,從旅客在其他領域活躍的數據信息來判斷旅遊群體的特征,從而更好的為旅客服務。
掌握大數據應用,就是把握好大數據投資的火候。不是盲目去投資大數據基礎設施,而是緊跟行業發展的趨勢,掌握大數據應用的本領,為企業更好地應用數據服務。
我們處在信息的時代,數據的時代,不能因為害怕落後被時代淘汰,就焦慮和盲從;也要避免盲目的投資的沖動,為了大數據而大數據,從而浪費企業寶貴的資源。大數據時代一定會到來,航空公司正確理解數據,聚焦數據,才是迎接大數據"風口"的"正確姿勢"。
新聞來源:環球旅訊