AI行業之戰,得“視覺”者得天下

科技巨頭和創業公司的一場大戰已經打響:打造最具價值的人工智能。而這場戰役的核心是擁有獨一無二的高品質視覺數據。

 

1495415712181047979.png

圖丨在語音助手里加上攝像頭,亞馬遜打出了漂亮的第一擊

贏得這一仗的關鍵是占領互聯攝像頭。人腦處理的大部分數據是視覺的,因此,人工智能要想獲得人類的技能或超越人類的技能,它所需要的數據大部分要依賴計算機解讀高品質視覺數據的能力。

將被人工智能徹底變革的其中一個商業領域是電子商務。亞馬遜憑借Echo Look打出了漂亮的第一擊。它在語音助手Echo上添加了攝像頭,這證實了我在去年做出的一個預言:攝像頭聯網(Internet of Eyes)將讓所有無生命物體都“看得見”。

企業需要收集數據以供計算機視覺和人工智能算法做分析,帶有攝像頭的無生命物體能讓它們實現這個過程的第一步。

 

1495415726611074839

圖丨視覺服務可以幫助客戶購買衣物。

“過去,自然界已經向我們展示了視覺是有智力的生物最強大的秘密武器之一,幫助它們在所處的復雜世界中探索、生存、互動并改造環境。人工智能系統也一樣。網絡超過八成的流量是照片、視頻等像素格式數據,如今帶攝像頭的智能手機數量已經超過了地球人口,而每一臺設備、機器以及我們所處的每一寸空間都將被智能傳感器賦予力量,”李飛飛說道,“打造智能機器的唯一途徑就是讓它獲得強大的視覺智能,就像生物在進化中所獲得的那樣。許多人都在尋找視覺的殺手級應用,而我要說,視覺是人工智能和計算的殺手級應用?!?/p>

社會在一定程度上被人們的自戀欲求推動——他們喜歡自拍,讓別人看到自己穿什么、吃什么、在哪兒度假、和誰在一起。人們拍照的一個主要原因是通過視覺來交流。

今天的網上電子商務也是由圖片和視頻驅動,而未來它會由帶攝像頭的無生命物體憑借計算機視覺和人工智能來驅動。我們的冰箱里會有攝像頭,汽車里到處都有攝像頭,還有監控攝像頭、管控花園用水量和室內溫度的視覺傳感器,等等。這些攝像頭會從影像、熱量、X射線、超聲波、白光中分析許多不同類型的可視化數據,生成高品質的信息——我們前所未見的信息。

IBM的沃森機器人已經和North Face、Macy’s、Sears等零售商合作,用人工智能來大幅提升顧客的購物體驗。我很討厭購物。我是那種很多年都穿同一種款式的人。有些事會讓我抓狂,比如我很喜歡一條紅色的褲子,我穿了很多年,直到穿破了只能換新的了,我就去商場里找一樣的褲子。我當然找不到了——他們已經不生產這條褲子了。

我一直幻想我的房間里能有個攝像頭每天給我拍照,時間久了它就知道我的風格了。安裝在家里的亞馬遜Echo Look、谷歌助理(Assistant)等帶攝像頭的物體最終會幫助我們解決這個問題。

有計算機視覺和人工智能做后盾的攝像頭應該會主動替我購物,不再需要我親自上網搜或到店里找了。理想化的情形是這樣的:亞馬遜的Alexa會發一封郵件給我,說“你最愛穿的那條紅褲子看起來已經撐不住了,你每天都穿這一條,我們發現屁股口袋上有個洞。我們覺得你會想知道,我們庫存里有兩條這樣的褲子,同樣顏色同樣尺寸。要不我幫你下單買一條,或者兩條都買下?”好哇!

只要摁一個下單鍵,它們就送到我家里了。我討厭購物的難題就這么解決了。從此我是一個非??鞓返念櫩?,因為我再也不用找啊找的了。

我也討厭買吃的和洗漱用品。假如我家里所有的攝像頭一起發力,我就再也不會斷糧了,那真是太棒了!最重要的是,我們再也不用耗費體力去找東西了,不管是在店里還是網上。

 

1495415745627098105.png

圖丨現代家居中,攝像頭無處不在,帶來了海量數據。

要處理家居攝像頭生成的呈指數級增長的視覺數據,需要擴大存儲和處理數據的基礎設施的規模,這只是挑戰之一。幸運的是,亞馬遜擁有世界上最大的云計算網絡之一。更艱難的戰事是利用恰當的人工智能算法來解密和理解照片、視頻等視覺數據中有價值的信息,從而使自家的人工智能技術獲得最高的智商。

計算機視覺專家、康奈爾大學理工學院的瑟奇·貝?。⊿erge Belongie)說:“人腦的大部分都參與處理視覺信息,使我們能夠解讀場景和探索空間等。視覺數據是我們了解世界的關鍵途徑,也因此,對智能機器的追求將需要在處理和解讀視覺信息的能力上實現大躍進?!?/p>

谷歌很快也會在Assistant上添加攝像頭,可能會與它的智能恒溫器Nest以及家居監控攝像頭Dropcam相連接。賣點是你的自拍照和由攝像頭網絡所捕捉的其他視覺數據。

人工智能將從你的視覺數據中學習,取代上網搜索購物的過程。很多創業公司正在創建的電子商務都會利用獨一無二的視覺數據和人工智能,這真是激動人心。大企業會競相打造強大的攝像頭,解讀我們的視覺數據,讓我們的生活變得更方便、有趣,也為它們帶來更多利潤。等著看,一場硬仗即將上演。

它的核心目標是獲取顧客獨一無二的視覺數據并屬亞馬遜專有,這樣它的計算機就能通過Echo Look抓取的自拍照盡可能地了解我們。這使得我們在它網站上的購物體驗變得更加便利高效。

斯坦福大學人工智能實驗室主任、谷歌云計算人工智能和機器學習研究團隊(AI/ML)首席科學家李飛飛說:“五億多年前,視覺成為寒武紀大爆發這場生物進化大爆發的主要驅動力,導致大量不同門類的生物迅速出現。五億年后,人工智能技術開始改變人類生活、工作、交流和塑造生存環境的方式?!?/p>