隨著我國社會經(jīng)濟的發(fā)展、城市化進程的加快,城市公共交通的規(guī)模也在不斷擴大。如何更好地發(fā)展與管理城市公交,實現(xiàn)其社會效益最優(yōu)化,并最大限度地提高公交企業(yè)管理水平、提高公交車輛運行效率,是目前面臨的現(xiàn)實問題。
公交行業(yè)由于傳統(tǒng)數(shù)據(jù)倉庫平臺的軟硬件擴容成本過高(teradata、oracle、小型機等),導致單位數(shù)據(jù)存儲成本與總體計算成本過高,為應對過高的 TCO(總體擁有成本),不得不對全量數(shù)據(jù)采取拆分存放,將大量歷史數(shù)據(jù)離線存儲,進而導致數(shù)據(jù)應用的不便;而基于傳統(tǒng)數(shù)據(jù)倉庫技術的報表式指標數(shù)據(jù)加工 手段,往往遵從T+1原則(業(yè)務日下一日),對于實時統(tǒng)計分析場景也缺乏有力支撐。以上兩點不足,都嚴重制約了公交行業(yè)數(shù)據(jù)的縱深應用。
如何更好地發(fā)展與管理城市公交,實現(xiàn)其社會效益最優(yōu)化,并最大限度地提高公交企業(yè)管理水平、提高公共交通運行效率,是目前面公交行業(yè)面臨的現(xiàn)實問題,而具體到實際應用,則主要體現(xiàn)為以下幾個具體問題:
政企協(xié)作問題:
如何科學、準確地評估公交財政投放總體資金規(guī)模?
如何科學、準確地評估購置車輛數(shù)量及對應購置費用數(shù)額?
如何科學、準確地評估存量車輛與增量車輛時間窗口內(nèi)的能耗情況,以及能耗對應的財政補貼?
乘客滿意度問題:
如何實時、準確地進行公交到站預測,優(yōu)化客戶候車預期,提升客戶滿意度?
如何科學、智能地優(yōu)化公交車輛調(diào)度,進而優(yōu)化線路運力水平,優(yōu)化客戶體驗?
如何科學、合理地劃分交通小區(qū),針對性配置社區(qū)“微循環(huán)”車輛,提升客戶出行感受?
精細化運營問題:
如何精細化開展運營監(jiān)測指標體系?如計劃里程/實際里程、計劃配車/實際出車、計劃配班/實際配班。
如何精細化開展運營分析指標體系?如配車情況分析、公里情況分析、配班情況分析、能耗分析、資源利用分析。
如何精細化開展實時監(jiān)測體系?如車輛狀態(tài)實時監(jiān)測、車輛位置實時監(jiān)測、車輛串車實時監(jiān)測預警、大間隔實時監(jiān)測預警、道路實時擁堵監(jiān)測。
而要解決這些問題,一個強大的大數(shù)據(jù)支持平臺必不可少,同時對大數(shù)據(jù)解決方案的提供商也提出了不小的挑戰(zhàn)。而作為民族企業(yè)大數(shù)據(jù)代表的睿至數(shù)據(jù),一直以來都在持續(xù)關注公交行業(yè)的發(fā)展,并為公交行業(yè)提供了完善的大數(shù)據(jù)解決方案。
技術方案
技術選型
實際上,選擇什么樣的大數(shù)據(jù)技術平臺則對于解決公交行業(yè)面臨的上述問題至關重要,由于Hadoop技術軟硬件體系擴容成本較低(開放技術、PC服務器),可 以大大降低單位數(shù)據(jù)存儲成本與計算成本,從而為全量數(shù)據(jù)在線,海量數(shù)據(jù)加工計算提供了先決條件;基于流數(shù)據(jù)的處理技術,使數(shù)據(jù)在產(chǎn)生的過程中,持續(xù)加工、 匯總、分析,實時產(chǎn)生價值信息,為類似實時斷面客流量統(tǒng)計、車輛滿載率分析、道路擁堵指數(shù)分析奠定了技術基礎??傃灾恍袠I(yè)主要考量的是供應商整體解 決方案的技術支撐能力和業(yè)務應用能力兩大能力。技術支撐能力包括大數(shù)據(jù)平臺軟硬件橫向擴展能力、擴展成本增速、實時數(shù)據(jù)處理能力、數(shù)據(jù)處理規(guī)模能力;業(yè)務 應用能力,包括除公交基礎指標應用外的數(shù)據(jù)挖掘模型類應用,如客流遷徙模型、新線開通模型、定制公交模型等應用。這兩大能力是公交大數(shù)據(jù)平臺建設過程中關 注的重點。
該項目中,睿至大數(shù)據(jù)做了很多模型,與公交行業(yè)充分結合,最終達到了很好的效果。這些模型包括了客流遷徒模型、職往模型、路網(wǎng)擁堵模型、職住平衡合理分布模型、乘客標簽與組分分析模型、車輛經(jīng)濟壽命模型、車輛經(jīng)濟效益模型。
架構解析
睿至公交大數(shù)據(jù)應用平臺從探尋城市環(huán)境下公交交通運行全局活動出發(fā),匯集公交交通運行過程中,政府管理部門、公交運行企業(yè)、公眾出行參與方共三方面多渠道多 角度的信息,揭示城市核心功能區(qū)主干路網(wǎng)OD特性,分析預測乘客遷徙動向,探究乘客流向與公交需求管理/線網(wǎng)規(guī)劃/線路開通之間的匹配度,剖析交通流與公 交交通線路規(guī)劃/交通突發(fā)事件的相互影響,統(tǒng)籌分析公交線路規(guī)劃合理性,洞察新的乘客流動趨勢,探索公交面對突發(fā)事件的最優(yōu)化處理方案。具體功能涵蓋四個 專題、七個模型。
四個專題指人、車、線、站專題:
專題“人”指,以乘客為著眼點,基于客流OD、斷面客流量、平均換乘、客運量、平均乘距、出行連等關鍵指標,精準刻畫城市客流時空流動特性;
專題“車”指,以車輛為著眼點,基于車輛能源消耗、故障率、車輛位置監(jiān)測、運行監(jiān)測、維修成本、運營監(jiān)測等關鍵指標,科學指導內(nèi)部運營,減少成本,提高效益;
專題“線”指,以公交線路、線網(wǎng)為著眼點,基于城市交通熱區(qū)、交通熱點、道路難度系數(shù)、線路重合度、斷面負載等關鍵指標,科學指導新線、新站開通;
專題“站”指,以公交站為著眼點,基于分散公交站點的乘客登降量、中轉(zhuǎn)量、集散量、覆蓋度、不均衡系數(shù)等關鍵指標,探尋公交站點功能性特性及引力特征;
該平臺通過數(shù)據(jù)源層、數(shù)據(jù)采集與交換層、數(shù)據(jù)存儲與計算層、應用層、門戶層的有機銜接來完成“數(shù)據(jù)”到“價值”的生產(chǎn)過程。數(shù)據(jù)源層包含公交業(yè)務運營過程中 的關鍵生產(chǎn)系統(tǒng),是數(shù)據(jù)產(chǎn)生的源頭。數(shù)據(jù)采集與交換層主要負責集中抽取數(shù)據(jù)源層各生產(chǎn)系統(tǒng)的數(shù)據(jù),并進行統(tǒng)一整合和清洗,然后進一步向數(shù)據(jù)存儲層傳遞。數(shù) 據(jù)存儲與計算層主要負責集中管理存儲整合、清洗后的全量數(shù)據(jù),同時提供基礎指標加工、特征數(shù)據(jù)加工、業(yè)務建模運算等計算能力,為數(shù)據(jù)應用奠定了可靠、全 量、簡易的數(shù)據(jù)基礎。應用層指基于數(shù)據(jù)存儲層的數(shù)據(jù)所開展的各類數(shù)據(jù)挖掘、分析類應用。最后,門戶層提供數(shù)據(jù)應用的統(tǒng)一認證與授權,保證了數(shù)據(jù)使用的安全 性。
用戶收益
睿至公交大數(shù)據(jù)應用平臺具有以下功能:
通過早晚高峰客流遷徙規(guī)律數(shù)據(jù),可以實現(xiàn)精細化規(guī)劃調(diào)度排班。從而提升運力,提高收益。定制直達公交。從而提升收益。
通過路網(wǎng)實時擁堵數(shù)據(jù),可以實現(xiàn)早晚高峰期間,公共車道和公交專用道的擁堵對比,通過影響出行市民乘坐公交,進而提升運力、增加效益。
通過職住平衡可視化模型,可以實現(xiàn)支持上級管理部門,評估城市規(guī)劃合理性。優(yōu)化城市布局。定制交通小區(qū)間的直達公交,從而提高收益。定制以交通小區(qū)為節(jié)點的串聯(lián)區(qū)間公交,從而提高收益。
此外,客戶標簽化,是公交精細化運營的基礎,通過乘客標簽化可進一步實現(xiàn):
精細化客流預測,即基于乘客上車時刻、在途時刻動態(tài)預測客流;
通過乘客組分分析,掌握不同群體組成結構,從而指導差異化產(chǎn)品創(chuàng)新、產(chǎn)品定價,進一步提升總體效益;
基于乘客組成結構、出行規(guī)律,支撐票務價格制定(最優(yōu)解),提高總體收益;
基于乘客組成的精準廣告服務,精準廣告投放,包括車身廣告、車載視頻廣告等。
北京睿至大數(shù)據(jù)所提供的公交大數(shù)據(jù)平臺方案,深入貼合 公交業(yè)務特性,真正實現(xiàn)了公交數(shù)據(jù)的深度應用。通過方案的落地實施,不僅打破了我們已有數(shù)據(jù)割裂式存放的困境,還發(fā)揮了數(shù)據(jù)全量在線的真正價值,通過交通 擁堵指數(shù)模型、客流遷徙模型、資產(chǎn)經(jīng)濟壽命模型、盈利刻畫模型的投產(chǎn)應用,使數(shù)據(jù)驅(qū)動創(chuàng)新成為可能,使數(shù)據(jù)驅(qū)動業(yè)務成為可能,也使數(shù)據(jù)創(chuàng)造收益成為可能。 在部署了該技術方案后,精確掌握了全市客流在早、晚高峰的時空流動特性。并基于該模型實現(xiàn)了定制公交、直達公交、智能調(diào)度等多項創(chuàng)新應用,助力決策層由 “經(jīng)驗型判斷”向“精確型判斷”邁出了一大步。同時,定制公交和直達公交在滿足城市公共出行服務的基礎之上,實現(xiàn)了較好的營業(yè)收入,在全市全轄所有線路 中,排名整體靠前。
經(jīng)驗總結
在方案落地初期,過重的強調(diào)的業(yè)務交付速度,忽視了數(shù)據(jù)治理基礎工作的重要性,導致正確的業(yè) 務模型和算法產(chǎn)出了有悖業(yè)務常識的計算結果。雖然經(jīng)過持續(xù)深入的數(shù)據(jù)血緣追溯,找出了問題的根源(數(shù)據(jù)質(zhì)量問題),并最終糾正了數(shù)據(jù)產(chǎn)出結果,但數(shù)據(jù)排錯 過程中付出了大量重復的工作量。所以,數(shù)據(jù)治理(元數(shù)據(jù)與數(shù)據(jù)質(zhì)量)是數(shù)據(jù)應用的可靠保障,只有正確的數(shù)據(jù)輸入才能保證正確的價值輸出。
同時,在項目實施的過程中所遇到的主要問題是數(shù)據(jù)增長速度預估不足,數(shù)據(jù)應用過程中的所導致的數(shù)據(jù)膨脹空間預估不夠,同時,數(shù)據(jù)量的增長過快又必然帶來計算 資源的緊張。針對以上問題,采取的手段是持續(xù)擴展大數(shù)據(jù)集群規(guī)模,然后進行數(shù)據(jù)再平衡分布(rebalance),雖然集群數(shù)據(jù)再平衡耗時較長,但完美解 決了應對數(shù)據(jù)快速增長所帶來的技術挑戰(zhàn)。