最近幾年的科學(xué)研究表明,在單次20分鐘的無人機(jī)飛行期間所捕捉到的空中圖像可能需要花費(fèi)半天以上的時(shí)間去分析。早些時(shí)候?yàn)榱藨?yīng)對(duì)“帕姆”颶風(fēng),我們在世界銀行的人道主義無人機(jī)任務(wù)中飛行了幾十次。我們捕捉到的圖像足以讓一位專家分析師專心致志工作至少20個(gè)全職工作日才能搞清楚。換句話說,航空影像已經(jīng)成為一個(gè)大數(shù)據(jù)問題。因此,我和我的團(tuán)隊(duì)正在使用人類計(jì)算(眾包)、機(jī)器計(jì)算(人工智能)和計(jì)算機(jī)視覺來理解這一新的大數(shù)據(jù)源。
例如,一些重慶大數(shù)據(jù)公司與南安普頓大學(xué)和EPFL合作,從航空影像中分析了颶風(fēng)“帕姆”在瓦努阿圖(西南太平洋島國)中所造成的破壞。這項(xiàng)研究的目的是為了能夠得到及時(shí)的響應(yīng)解答。救援組織想要的不僅僅是受災(zāi)地區(qū)的高分辨率航拍圖像,他們需要的是答案;例如,受損建筑物的數(shù)量和位置,流離失所的人們的數(shù)量和位置,以及還有哪些道路仍然可用來運(yùn)送救援物資等。簡單地給他們圖像是遠(yuǎn)遠(yuǎn)不夠的。正如我在新書《數(shù)字人道主義者》中所表明的觀點(diǎn)那樣,援助和發(fā)展組織已經(jīng)被災(zāi)前災(zāi)后產(chǎn)生的擁有巨大體量和迅猛速度的大數(shù)據(jù)所淹沒。再加上另一個(gè)數(shù)據(jù)源“空中大數(shù)據(jù)”可能是毫無意義的,因?yàn)檫@些組織可能根本沒有時(shí)間和能力來理解這些新數(shù)據(jù),更不用說將結(jié)果與其他數(shù)據(jù)集成在一起了。我們分析了部署用來跟蹤颶風(fēng)帕姆的MicroMappers平臺(tái)的眾包結(jié)果,以確定這些數(shù)據(jù)是否可以用來訓(xùn)練未來能在瓦努阿圖遭受災(zāi)難的過程中自動(dòng)檢測災(zāi)難損害的算法。在整個(gè)MicroMappers的部署期間,數(shù)字志愿者分析了3000多張高分辨率的傾斜航空?qǐng)D像,追蹤那些可能被完全摧毀、部分受損、基本完好的房屋。我和同事Ferda Ofli與Nicolas Rey(暑期和我們共事的EPFL研究生)合作,探索這些痕跡是否可以用來訓(xùn)練我們的算法。下面的結(jié)果則出自Ferda和Nicolas之手。我們的研究不僅僅是一項(xiàng)學(xué)術(shù)活動(dòng)。瓦努阿圖是世界上最易受災(zāi)的國家。此外厄爾尼諾現(xiàn)象(El Ni?o)可能是半個(gè)世紀(jì)以來最強(qiáng)的一次。
根據(jù)眾包結(jié)果,1145幅高分辨率圖像中沒有包含任何建筑物。以上是一個(gè)簡單的直方圖,描述每幅圖中建筑物的數(shù)量。瓦努阿圖的航拍圖像是非常不均勻的,不僅在它們展示的特征多樣性上有所不同,而且在視角和拍攝的高度也各不相同。雖然絕大多數(shù)的圖像是傾斜的,有些圖像幾乎是最低點(diǎn)圖片,有些則非常接近地面,甚至是在起飛之前拍的。
我們的圖像數(shù)據(jù)集的異質(zhì)性使得這種圖像的自動(dòng)分析更加困難。此外,我們數(shù)據(jù)集中還存在很多尚在施工中的建筑物,因?yàn)樗鼈兛雌饋砗芟駬p壞的建筑物,所以識(shí)別起來也是一個(gè)大難題。我們的第一項(xiàng)任務(wù)是訓(xùn)練算法,以確定任意給定的航空?qǐng)D像中是否顯示了某種建筑物。這是一個(gè)重要的任務(wù),因?yàn)樵谖覀兊臄?shù)據(jù)集中超過30%的圖像不包含建筑物。因此,如果我們能夠開發(fā)出一種精確的算法來自動(dòng)過濾掉這些無關(guān)的圖像(比如下面的“噪音”),這樣我們就能集中心力于處理相關(guān)圖像的眾包分析。
迄今為止雖然我們的研究結(jié)果還處于初級(jí)階段,但我們已經(jīng)對(duì)所發(fā)現(xiàn)的東西感到欣慰了。我們訓(xùn)練用來確定一幅空中圖像中是否包括建筑物的算法已經(jīng)達(dá)到90%以上的精度了。更確切地說,我們的算法能夠識(shí)別和過濾掉60%不包含任何建筑物(召回率)的圖像,而且只有10%包含建筑物的圖像被錯(cuò)誤地丟棄(精確率為90%)。下面就是舉例。毫無疑問現(xiàn)在仍然存在很多的重大挑戰(zhàn),所以我們希望在現(xiàn)階段不做出過分承諾。在接下來的步驟中,我們將探索我們的計(jì)算機(jī)視覺算法是否能夠區(qū)分遭到破壞或者保存完好的建筑物。
我們之前在瓦努阿圖使用的無人機(jī)還需要我們操作著陸才能獲得采集到的圖像。現(xiàn)在越來越多的新型無人機(jī)提供了實(shí)時(shí)地將航拍圖像和視頻傳送回基地的功能。例如,大疆推出的“精靈”系列新品Phantom 3無人機(jī)(見下圖)就允許用戶將航空視頻直接發(fā)送到Y(jié)ouTube進(jìn)行直播(假設(shè)有連接)。毫無疑問,這是無人機(jī)工業(yè)的發(fā)展方向:實(shí)時(shí)數(shù)據(jù)收集和分析。在人道主義應(yīng)用中的搜索和救援等方面,實(shí)時(shí)進(jìn)行數(shù)據(jù)分析是更上一層樓的。