一、大數(shù)據(jù)ABC
2. 美國“大數(shù)據(jù)”事業(yè)發(fā)展
大數(shù)據(jù)(BIG DATA)是指所涉及到的數(shù)據(jù)量規(guī)模巨大到無法通過人工在合理時(shí)間內(nèi)達(dá)到獲取、管理、處理、并整理成為人類所能解讀的信息。
5. 大數(shù)據(jù)4V特性
花樣多、體量大、速度快、價(jià)值高
6. 數(shù)據(jù)從哪來?
數(shù)據(jù)來源主要從以下四個(gè)渠道:
互聯(lián)網(wǎng)公司(BAT等)
通信運(yùn)營商(移動(dòng)、聯(lián)通、電信)
金融、酒店、醫(yī)療、電力等行業(yè)
物聯(lián)網(wǎng)、傳感器等
7. 大數(shù)據(jù)商業(yè)價(jià)值
8. 大數(shù)據(jù)的行業(yè)應(yīng)用
大數(shù)據(jù)在各個(gè)行業(yè)上的應(yīng)用都很廣泛,舉幾個(gè)例子:
大數(shù)據(jù)的應(yīng)用幾乎覆蓋了所有行業(yè),企業(yè)、娛樂、電商、政府、醫(yī)療等等,這些大數(shù)據(jù)往往只是基于互聯(lián)網(wǎng),但我們不應(yīng)摒棄傳統(tǒng)數(shù)據(jù),那些基于數(shù)據(jù)統(tǒng)計(jì)、問卷調(diào)查、用戶訪談、人工統(tǒng)計(jì)、遙感影像、地圖測繪等渠道獲得的傳統(tǒng)數(shù)據(jù)同樣具有價(jià)值,要將傳統(tǒng)數(shù)據(jù)與大數(shù)據(jù)相結(jié)合。
二、 大數(shù)據(jù)時(shí)代的旅游業(yè)
旅游行業(yè)有行業(yè)廣、規(guī)模大、移動(dòng)性強(qiáng)的特點(diǎn),因此更加依賴大數(shù)據(jù)。當(dāng)前,旅游業(yè)也在“新常態(tài)”下迎來了升級的挑戰(zhàn)和變革的機(jī)遇,新常態(tài)對于一般的經(jīng)濟(jì)部門是經(jīng)濟(jì)速度放慢、人均GDP增速減小,很多傳統(tǒng)行業(yè)在調(diào)整結(jié)構(gòu),但新常態(tài)對旅游行業(yè)卻是速度加快的。
對大數(shù)據(jù)來講,和旅游業(yè)產(chǎn)業(yè)的密切配合主要體現(xiàn)在以下幾個(gè)方面:
(1)景區(qū)票務(wù)系統(tǒng)可統(tǒng)計(jì)游客量數(shù)據(jù),通過與互聯(lián)網(wǎng)、運(yùn)營商等第三方大數(shù)據(jù)整合,可對未來幾天人流量、車流量進(jìn)行預(yù)測;
(2) 智慧景區(qū)監(jiān)控系統(tǒng)可對突發(fā)事件如踩踏、擁擠進(jìn)行實(shí)時(shí)監(jiān)測,及時(shí)預(yù)警;
(3)通過監(jiān)控系統(tǒng)及數(shù)據(jù)分析,對景區(qū)人力、物力資源進(jìn)行科學(xué)分配,并加強(qiáng)市場違規(guī)行為管理
(4) 通過景區(qū)一卡通系統(tǒng),可以對游客的屬性、行為偏好進(jìn)行分析,同時(shí)整合互聯(lián)網(wǎng)大數(shù)據(jù),可以針對全國市場范圍進(jìn)行客源地與目標(biāo)消費(fèi)者的精準(zhǔn)定位;
三、 為旅游分析大數(shù)據(jù)
數(shù)據(jù)分析共五個(gè)流程:數(shù)據(jù)獲取→預(yù)處理→綜合分析(數(shù)據(jù)模型)→成果可視化→對策應(yīng)用
(1)數(shù)據(jù)獲取:游前、游中、游后全過程的大數(shù)據(jù)獲取,傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)相結(jié)合。
(2)綜合分析(數(shù)據(jù)模型):將數(shù)據(jù)預(yù)處理后,進(jìn)行數(shù)模分析,例如將過去五年的五一黃金周游客的來源和過去五年景區(qū)的銷售記錄建成數(shù)據(jù)模型,根據(jù)模型預(yù)測明年甚至后年的游客量、游客從哪來?這對于市場非常重要,可以根據(jù)這些特點(diǎn)對癥下藥。
(3)對策應(yīng)用
(4) 景區(qū)對大數(shù)據(jù)應(yīng)用的困境
(5)景區(qū)對大數(shù)據(jù)應(yīng)用的解決之道
四、 為景區(qū)生產(chǎn)數(shù)據(jù)產(chǎn)品
隨著“互聯(lián)網(wǎng)+”時(shí)代的到來,包括旅游業(yè)在內(nèi)的傳統(tǒng)行業(yè)迎來了一次大變革。大地云游多年深耕于旅游行業(yè),基于宏觀經(jīng)濟(jì)、旅游產(chǎn)業(yè)、遙感及GIS數(shù)據(jù)等構(gòu)建了龐大的數(shù)據(jù)庫,并同百度等大數(shù)據(jù)企業(yè)開展深度跨界合作,整合了包括百度搜索引擎、百度地圖、百度糯米等50條產(chǎn)品線的上億用戶量的數(shù)據(jù),雙方共同開發(fā)了旅游行業(yè)的大數(shù)據(jù)產(chǎn)品——“景區(qū)大數(shù)據(jù)畫像”。
百度大數(shù)據(jù)和大地云游兩家共同合作,提出一套理論叫做用戶痕跡復(fù)原分析法。用戶痕跡復(fù)原分析法,它的作用一是能夠把握景區(qū)發(fā)展外部環(huán)境與市場導(dǎo)向,洞察游客基本屬性與行為特征,精準(zhǔn)分析游客旅游路線,實(shí)時(shí)監(jiān)控景區(qū)游客量。二是為城市及景區(qū)實(shí)現(xiàn)旅游市場細(xì)分、旅游營銷診斷、景區(qū)精準(zhǔn)管理提供有力工具。
景區(qū)自己搞大數(shù)據(jù)是比較困難的,存在著數(shù)據(jù)獲取困難、寄存存儲困難、分析方法不了解等問題,未來的發(fā)展方向應(yīng)該是景區(qū)收集內(nèi)部的小數(shù)據(jù)然后和專業(yè)公司合作,用大數(shù)據(jù)、小數(shù)據(jù)、大小結(jié)合提出一個(gè)整套的方案,景區(qū)自身要注重線下數(shù)據(jù)積累,建立流行化平臺,建立一個(gè)數(shù)據(jù)中心,和數(shù)據(jù)專家溝通,提出一套適合自身景區(qū)的方案。這適用于所有旅游局、旅游景區(qū)、酒店旅行社等,都可以做這樣的旅游分析的報(bào)告用來幫助景區(qū)定位、分析、營銷、提高景區(qū)投入回報(bào)率。
怎么為景區(qū)數(shù)據(jù)生產(chǎn)?用旅游專業(yè)的知識和經(jīng)濟(jì)框架,用百度大數(shù)據(jù)包括百度搜索引擎、百度地圖、百度糯米等上億用戶量的數(shù)據(jù),以景區(qū)為案例和景區(qū)大數(shù)據(jù)框架。
數(shù)據(jù)有兩種來源,一種是我們過去積累的傳統(tǒng)數(shù)據(jù),如區(qū)域經(jīng)濟(jì)數(shù)據(jù)、遙感數(shù)據(jù)、GIS數(shù)據(jù),另一種是游客微觀數(shù)據(jù),包括百度大數(shù)據(jù)及新浪微博等,使用用戶痕跡復(fù)原分析法將景區(qū)四方面情況把它展現(xiàn)出來,這樣的一套診斷工具、管理工具、營銷工具、可以為景區(qū)提供規(guī)劃、發(fā)展之路。
大地云游旅游數(shù)據(jù)庫包括:
(1)區(qū)域經(jīng)濟(jì)數(shù)據(jù)
全國各地級市的旅游產(chǎn)業(yè)數(shù)據(jù),包括旅游收入、游客量、出入境旅游人次、人口、GDP、財(cái)政收入、居民收入水平、居民消費(fèi)能力等等; (2)遙感衛(wèi)星數(shù)據(jù)
包括EOS衛(wèi)星、Landsat衛(wèi)星數(shù)據(jù)、全國DEM地形數(shù)據(jù)等;
(3)GIS數(shù)據(jù)
全國各縣、各地級市、交通路網(wǎng)(包括高速路、國道、省道、鐵路等)、全國機(jī)場、旅游景點(diǎn)等的GIS數(shù)據(jù);
(4)氣象數(shù)據(jù)
全國各監(jiān)測站近30年的707個(gè)氣象監(jiān)測站的數(shù)據(jù),包括各月氣溫(℃)、相對濕度(%)、日照時(shí)數(shù)(h/d)、平均風(fēng)速(m/s)等。
游客微觀數(shù)據(jù)庫包括:
(1)百度搜索
作為全球最大的中文搜索引擎,百度每天響應(yīng)超過100億次來自電腦手機(jī)的搜索請求,為超過全國95%的網(wǎng)民發(fā)現(xiàn)答案,提供所需;
(2)百度地圖百度地圖每天響應(yīng)超過100億次定位請求,基于百度地圖定位數(shù)據(jù),可以對游客軌跡進(jìn)行精準(zhǔn)刻畫;
(3)百度用戶畫像
基于百度超過50條產(chǎn)品線數(shù)據(jù)以及海量外部線上線下數(shù)據(jù)進(jìn)行深度挖掘,從人口的自然、社會(huì)、地理位置屬性和興趣關(guān)注等維度,以及醫(yī)療、教育、旅游等32個(gè)垂直行業(yè)細(xì)分萬級別標(biāo)簽,全方位刻畫用戶屬性偏好,采用最高精度算法和最全多屏用戶數(shù)據(jù),覆蓋國內(nèi)超過4億用戶,采用DNN深度學(xué)習(xí)、規(guī)則與統(tǒng)計(jì)分析、WordVec等挖掘算法,挖掘結(jié)果準(zhǔn)確率大于90%;
(4)新浪微博
用戶在新浪微博的評論及簽到數(shù)據(jù)。
案例研究:武夷山旅游景區(qū)
將大地云游數(shù)據(jù)庫中全國345個(gè)地級市(含省直轄縣)統(tǒng)計(jì)數(shù)據(jù)、GIS數(shù)據(jù)與遙感數(shù)據(jù)進(jìn)行整合;百度數(shù)據(jù)的采集時(shí)間為2015年1月1日至2015年4月7日,來過武夷山和福建的游客,數(shù)據(jù)規(guī)模為2000萬游客數(shù)據(jù);微博數(shù)據(jù)采集時(shí)間為2014年9月23日至10月8日(含十一黃金周),10000余條新浪微博記錄建立一個(gè)分析體系。
這個(gè)分析體系可以給景區(qū)外部環(huán)境分析、客源市場分析、旅客量預(yù)測、景區(qū)熱力圖、市場氣氛、關(guān)聯(lián)景區(qū)分析、也就是這批游客到了武夷山同時(shí)還玩了哪幾個(gè)景區(qū),幾個(gè)景區(qū)就可以一起做區(qū)域合作、做共同營銷,這是有數(shù)據(jù)基礎(chǔ)的。分別對武夷山景區(qū)進(jìn)行外部環(huán)境分析和客源地及市場洼地探析。
1. 外部環(huán)境分析
武夷山外部環(huán)境分析—旅游發(fā)展階段:以武夷山為中心的周邊地區(qū),包括長三角、福建、珠三角等,已經(jīng)進(jìn)入觀光與休閑旅游多元化階段。
這是由于武夷山景區(qū)有較適宜的外部環(huán)境,包括:
2. 客源地及市場洼地探析
從客源市場角度來講,通過大數(shù)據(jù)對武夷山客源地分析,根據(jù)百度地圖LBS定位,2015年1月1日至2015年4月7日到達(dá)武夷山的游客數(shù)據(jù)總量70萬人次的記錄量??梢耘袛嗫驮吹氐膩碓矗驮吹匾愿=ū臼【用窬佣?,其次是上海、浙江、江西等較近旅游市場??驮闯鞘信琶来螢椋耗掀健⒏V?、廈門、北京、上海、泉州、杭州、上饒、溫州、三明、廣州、蘇州、漳州、深圳、金華、寧德、沈陽、鄭州、無錫、莆田。通過這些客觀的數(shù)據(jù)可以有針對性的進(jìn)行區(qū)域宣傳。
通過百度可以統(tǒng)計(jì)出過去三個(gè)月中全國人民哪些區(qū)域搜索武夷山的關(guān)鍵詞,最集中的搜索量依次是南平市、福州市、廈門市、北京市、泉州市、上海市、杭州市、廣州市等對武夷山搜索量較高。但搜索量高卻沒有到武夷山來,這就是客源漏損指數(shù),客源漏損指數(shù)是通過游客實(shí)際到訪量與搜索量計(jì)算得來。漏損指數(shù)較高城市依次是南通、成都、合肥、臨沂、揚(yáng)州、揭陽、天津、石家莊。對漏損原因進(jìn)行深度分析作為重點(diǎn)突破。
省內(nèi)競爭指數(shù):某一城市到訪武夷山游客量與到訪福建省游客量之比。省內(nèi)競爭指數(shù)較低城市:南寧、贛州、重慶、深圳、揭陽、惠州、珠海、合肥、東莞、廣州、??冢ㄟ@些地區(qū)來福建游客到武夷山之外的福建旅游城市較多)。省內(nèi)競爭指數(shù)較高城市:衢州、麗水、上饒、承德、張家口、牡丹江、金華、鞍山、邯鄲、東營(這些地區(qū)來福建游客到武夷山人數(shù)較其他福建城市為多)。
3. 景區(qū)游客量預(yù)測
百度對九寨溝做過一個(gè)研究,游客從哪幾個(gè)城市會(huì)飛到九寨溝來?游客會(huì)乘坐什么交通工具?各個(gè)客源地城市游客的數(shù)量有多少?百度大數(shù)據(jù)可以預(yù)測。
華北、西北、東北地區(qū)游客量與逗留時(shí)長之間呈現(xiàn)明顯的U型曲線,較長時(shí)間滯留游客比例較大,華中、華南、西南等地游客逗留時(shí)長不夠高。
與百度旅游網(wǎng)民數(shù)據(jù)相比,武夷山游客中女性游客占比要高于百度旅游網(wǎng)民中女性比重,表明女性相對男性對武夷山更為青睞。
本科及以上學(xué)歷的游客占游客總量的61%,表明學(xué)歷層次較高的游客對武夷山景區(qū)頗為青睞,同時(shí),百度對更精細(xì)的學(xué)歷層次正在研發(fā)中,即將推出。
文體娛樂、IT通信、醫(yī)藥衛(wèi)生、住宿旅游等職業(yè)的游客在武夷山總游客量中占比最高,與百度旅游網(wǎng)民相比,文體娛樂、IT通信、醫(yī)藥衛(wèi)生等職業(yè)的游客對武夷山更為青睞。
武夷山游客中有車的游客占比32%,高于全體國民中有車人士占比,表明在產(chǎn)品開發(fā)方面,武夷山景區(qū)可針對自駕車游客策劃自駕車營地項(xiàng)目等;
武夷山游客對社交、網(wǎng)購、旅游、金融財(cái)經(jīng)等興趣較高,在制定營銷策略時(shí),可以針對社交性的媒體、網(wǎng)購類網(wǎng)站、旅游類網(wǎng)站等選擇合適的營銷渠道;
青年旅舍在80、90后游客中占比最高,深受青年人的喜愛;快捷酒店以其標(biāo)準(zhǔn)化、高性價(jià)比的服務(wù)對商務(wù)人群、學(xué)生群體吸引力較大,品牌忠誠度較高;
景點(diǎn)關(guān)注度:游客對天游峰、九曲溪、一線天、水簾洞、大王峰、玉女峰、虎嘯巖、龍川等景點(diǎn)的關(guān)注度最高,表明這些景點(diǎn)的品牌知名度較高。
外地游客來武夷山旅游的同時(shí),還去鼓浪嶼、左海公園、福建土樓、燕尾山公園、胡里山炮臺等景點(diǎn)旅游,鼓浪嶼是外地游客去福建省旅游的主要旅游目的地之一。
(1)微博語義分析:游客所發(fā)微博內(nèi)容主要圍繞“武夷山”、“旅行”和“紅袍”三個(gè)關(guān)鍵詞展開。其中“旅行”、“竹筏”、“漂流”等關(guān)鍵詞代表游客對這類旅游項(xiàng)目關(guān)注度較高;“紅袍”、“茶葉”、“喝茶”代表游客對于武夷山當(dāng)?shù)夭枞~特產(chǎn)的關(guān)注度較高。
(2)微博情緒分析:通過數(shù)據(jù)挖掘,對微博內(nèi)容進(jìn)行情緒語義分析,并將其分為積極、中性和消極三類,其中積極情緒占比最高,占比達(dá)57%,消極情緒占比最低,總體來看,游客對武夷山的印象以積極正面為主。
武夷山景區(qū)改進(jìn)策略:
五、 從非移動(dòng)景區(qū)到移動(dòng)旅游目的地
過去旅游產(chǎn)品是旅游到什么地方去,景區(qū)是不可以移動(dòng)的,在旅游學(xué)教科書里是這樣強(qiáng)調(diào)的。但是在如今的大數(shù)據(jù)時(shí)代,在移動(dòng)互聯(lián)網(wǎng)時(shí)代,在移動(dòng)知識時(shí)代,你的旅游目的地要變成移動(dòng)目的地,也就是說從非移動(dòng)地區(qū)到移動(dòng)旅游目的地的一個(gè)變化。
(4)移動(dòng)性(mobility)控制一切
(5)移動(dòng)中的社交媒體及其對品牌影響
現(xiàn)在全球的旅游研究當(dāng)中,最核心的是移動(dòng)性研究,不是簡單的信息、交通,而是人本身的移動(dòng),根據(jù)移動(dòng)的特征進(jìn)行景區(qū)的管理。移動(dòng)性需要靠大數(shù)據(jù)來研究,景區(qū)移動(dòng)性、大數(shù)據(jù)、移動(dòng)旅游目的地、這些邏輯關(guān)系是非常清晰的,我們過去的游客中心就是放幾個(gè)地圖,兩個(gè)景區(qū)工作人員介紹,而現(xiàn)在的大數(shù)據(jù)時(shí)代把他變成非移動(dòng)和移動(dòng)的交接點(diǎn),這時(shí)的游客中心就要進(jìn)行非常徹底的改造。移動(dòng)性的管理,擁擠、地質(zhì)災(zāi)害、警告、檢測都是要?jiǎng)討B(tài)的。建議地方政府要把wifi免費(fèi)。
結(jié)論
(1)“互聯(lián)網(wǎng)+”時(shí)代,大數(shù)據(jù)促進(jìn)旅游產(chǎn)業(yè)轉(zhuǎn)型升級
(2) 旅游大數(shù)據(jù)的應(yīng)用價(jià)值在于多數(shù)據(jù)源的整合
(3)旅游大數(shù)據(jù)指導(dǎo)景區(qū)管理已初見成效
(4) 如何進(jìn)一步提升旅游大數(shù)據(jù)效用仍然任重而道遠(yuǎn)
(5)移動(dòng)互聯(lián)網(wǎng)時(shí)代,景區(qū)已經(jīng)不再靜止不移
(內(nèi)容由大地風(fēng)景研究院根據(jù)吳必虎教授在“第十屆全國旅游景區(qū)創(chuàng)A培訓(xùn)班”演講內(nèi)容整理,技術(shù)支持來自大地云游。)