摘要 : 科技互聯(lián)網(wǎng)行業(yè)屬于典型的技術(shù)創(chuàng)新周期性行業(yè),其中的任何產(chǎn)品形態(tài)都不是突然出現(xiàn)的,而是以雛形的形式長期潛伏,當(dāng)?shù)竭_(dá)一個(gè)臨界點(diǎn)(就是極客們常說奇點(diǎn))后爆發(fā),進(jìn)入到快速普及狀態(tài)。
翻篇到了2015年,除了讓人老了一歲唯一能讓人安慰的就是我們距離未來科技又近了一步。在《黑鏡》和《Her》當(dāng)中那些貌似要“很久以后”才能觸碰到的超強(qiáng)人工智能和技術(shù)創(chuàng)新,其實(shí)已在2014年步步逼近?;ヂ?lián)網(wǎng)科技行業(yè)噴發(fā)式的發(fā)展,給我們展示了未來科技的雛形。
科技互聯(lián)網(wǎng)行業(yè)屬于典型的技術(shù)創(chuàng)新周期性行業(yè),其中的任何產(chǎn)品形態(tài)都不是突然出現(xiàn)的,而是以雛形的形式長期潛伏,當(dāng)?shù)竭_(dá)一個(gè)臨界點(diǎn)(就是極客們常說奇點(diǎn))后爆發(fā),進(jìn)入到快速普及狀態(tài)。
于是乎,在2015伊始,筆者想要盤點(diǎn)一些技術(shù),也許并不是天天用的高粘性技術(shù),而是具備巨大想象空間的,這類技術(shù)往往會(huì)對(duì)未來有著巨大的影響。
VR技術(shù):“現(xiàn)實(shí)”裝入“虛擬”當(dāng)中
VR技術(shù)在過去的20年里悄悄都潛伏在實(shí)驗(yàn)室里面,而2014年VR技術(shù)第一次迸發(fā)出無窮想象力。3月16日Facebook宣布20億美元收購Oculus公司,后者正是一家沉浸式虛擬現(xiàn)實(shí)技術(shù)(VR)的領(lǐng)先公司。這20億美元買的就是“計(jì)算設(shè)備和娛樂的未來”。Oculus最著名的就是推出了頭戴式顯示器Oculus Rift。這款產(chǎn)品利用內(nèi)置的陀螺儀和顯示屏能夠打造出真正的虛擬顯示場景,把“虛擬”貫穿到視覺、聽覺、觸覺、動(dòng)覺當(dāng)中,替代了“現(xiàn)實(shí)”。
如果我們仔細(xì)回想一下計(jì)算機(jī)過去50年里的發(fā)展趨勢就不難想象VR技術(shù)的巨大想象空間。早年因?yàn)殡娔X笨重又大很難是個(gè)人的,不便于使用,然后臺(tái)式機(jī)出現(xiàn)了,我們進(jìn)入了個(gè)人可以直接在書桌上與計(jì)算機(jī)互動(dòng)的時(shí)代。之后,筆記本電腦,我們可以隨身攜帶計(jì)算機(jī)。今天我們將計(jì)算機(jī)裝進(jìn)了自己的口袋。按照這種發(fā)展模式走下去,計(jì)算機(jī)會(huì)與我們的身體越來越親密。這意味著未來計(jì)算機(jī)可能戴在我們頭上,然后用眼睛去跟它互動(dòng)。VR技術(shù)實(shí)際上就是這種解決方式的先行者。
在過去的2014年,Oculus的發(fā)展?fàn)縿?dòng)人心,首批1000個(gè)面向開發(fā)者的Oculus Rift DK2原型機(jī)早早就被搶購一空,市場上一機(jī)難求。而分布在全球各地狂熱的開發(fā)者不知疲倦的讓Oculus Rift變得更好玩,在Oculus相關(guān)論壇里每天都會(huì)有不同的Mod出現(xiàn)供大家測試。在CES 2014上Virtuix Omni還推出了配合Oculus Rift的跑步機(jī)來玩
《戰(zhàn)地 4》游戲。如果你看過相關(guān)視頻,你一定會(huì)在結(jié)尾處大吼一聲:這才是游戲的最終形態(tài)!
2014年是VR技術(shù)大放異彩的元年,在近期的百度BIG Talk大會(huì)上,斯坦福大學(xué)虛擬互動(dòng)實(shí)驗(yàn)室創(chuàng)始人Jeremy Bailenson說虛擬現(xiàn)實(shí)技術(shù)很快將會(huì)到來。也許未來我們的電腦將會(huì)消失,VR將會(huì)承載新的使命。
看“臉”時(shí)代:圖像搜索大數(shù)據(jù)
你想知道蝦和番茄能不能一起吃,于是你輸入文字百度了一下,有了答案。而如果你手上有一張名畫照片想知道作者怎么辦?相信很大一部分人都會(huì)束手無策,因?yàn)檫@是一張圖片。
相比語言搜索功能圖像搜索被譽(yù)為是下一個(gè)重要的互聯(lián)網(wǎng)入口,這源于一個(gè)不可逆轉(zhuǎn)的現(xiàn)實(shí)——人們從外界獲取信息,其中90%來自于視覺。當(dāng)有東西無法用語言傳遞、表達(dá)時(shí),你第一個(gè)想到的就是靠圖像、影像。你想想看,當(dāng)你在街上看到一件別人身上的衣服很好看,你想自己上網(wǎng)搜搜看哪里能買到,在不知道品牌型號(hào)的情況下,你要怎么給一個(gè)機(jī)器解釋你的所看所感?就算你形容能力無敵了,但你有心思花那么多時(shí)間在組織搜索語言上嗎?所以機(jī)器還要更加的智能,不但能理解一句話,還要可以直接分析你看到的圖像和片段,你總是想要簡單的對(duì)吧。
圖片搜索就是目前火熱的CBIR技術(shù),這個(gè)92年由Kato教授提出的理論距今已經(jīng)20年。CBIR的基礎(chǔ)原理是系統(tǒng)對(duì)用戶輸入的圖像進(jìn)行分析并分類統(tǒng)一建模, 然后根據(jù)各種圖像模型提取圖像特征存入特征庫,然后尋找符合相關(guān)條件的結(jié)果進(jìn)行反饋。目前Google、Bing、百度三大搜索引擎均具備相關(guān)技術(shù)。其中Google搜索從Googlelabs一個(gè)項(xiàng)目演化而成,目前支持圖片上傳搜索和URL地址檢索。而微軟旗下的Bing則只支持基礎(chǔ)的關(guān)鍵字圖像匹配,精確度算法還有待提高。其他類似TinyEy等創(chuàng)業(yè)型圖像搜索引擎脫胎于大學(xué)實(shí)驗(yàn)室,而曾經(jīng)火過一段時(shí)間的GozoPa已經(jīng)低調(diào)關(guān)閉B2C轉(zhuǎn)型B2B業(yè)務(wù)。
小公司在做需要大數(shù)據(jù)的工程總顯得捉襟見肘。再舉個(gè)國內(nèi)的反例,淘寶在12年推出過類似圖像搜索的功能,不過隨后運(yùn)營不佳關(guān)閉。目前中國具備做好圖像搜索能力的就只有百度,14年8月手機(jī)百度正式更新到5.5版,新版本新增的拍照搜索,被業(yè)界定義為圖像搜索的2.0版本,在目前大多數(shù)用戶還在掃描二維碼、提前設(shè)定場景等OCR功能的拍照產(chǎn)品當(dāng)中,手機(jī)百度是全球首款支持任意實(shí)物進(jìn)行拍照搜索的產(chǎn)品。不過相信在未來,圖像搜索會(huì)隨著VR技術(shù)的成熟變等更大眾普及,前景不可估量。
語音技術(shù):能說的,就不用動(dòng)手
如果說圖片搜索解決了機(jī)器對(duì)圖片的“理解”,那么語音技術(shù)就是解決了人與機(jī)器“交流”的問題。語音技術(shù)從IBM的一個(gè)小工具軟件到今天已經(jīng)有了十來年歷史。而隨著3G/4G帶動(dòng)的移動(dòng)互聯(lián)網(wǎng)市場興起,語音識(shí)別成為有希望挑戰(zhàn)傳統(tǒng)搜索引擎的下一個(gè)產(chǎn)品,最近四年是語音技術(shù)發(fā)展最快的黃金期。
從技術(shù)角度來講,語音識(shí)別主要流程為“語音提取——聲紋轉(zhuǎn)化——分詞——語義識(shí)別”的過程,在后三步都需要借鑒到龐大的數(shù)據(jù)庫,需要大投入長時(shí)間的研究,技術(shù)資金門檻較高。而其中的分詞,尤其是中文分詞,需要海量的數(shù)據(jù)樣本做分析。而目前語音市場分為三大派系:
1:國企、大學(xué)院校研發(fā)背景的傳統(tǒng)語音廠商(科大訊飛、捷通華聲)。
2:互聯(lián)網(wǎng)巨頭廠商(百度、阿里、騰訊)
3:小的創(chuàng)業(yè)公司例如云之聲、思必馳等。
這些廠商均有各自擅長的領(lǐng)域,其中科大訊飛在軍用、行業(yè)級(jí)當(dāng)中應(yīng)用頗廣。而百度為首的互聯(lián)網(wǎng)廠商則在民用商業(yè)化方面捷足先登,創(chuàng)業(yè)公司則更加專注于細(xì)分市場。從目前來看科大訊飛目前在識(shí)別行業(yè)處于領(lǐng)頭羊地位,產(chǎn)品適用范圍廣技術(shù)底蘊(yùn)強(qiáng),目前的軍用、企業(yè)級(jí)使用較多,值得一提的是科大訊飛在技術(shù)專利方面也可以與國外語音巨頭Nuance一拼。
不過,從消費(fèi)者層面來講好的語音識(shí)別系統(tǒng)很大程度上依靠經(jīng)驗(yàn),專利和算法什么的并沒有多重要。語音識(shí)別這兩年并沒有著力于傳統(tǒng)路線,而是向上發(fā)展為神經(jīng)網(wǎng)絡(luò)(你可以理解為每臺(tái)服務(wù)器就是大腦的一個(gè)神經(jīng)元),也就是語義識(shí)別,這里面涉及的就是人工智能和深度學(xué)習(xí)。如果說科大訊飛國內(nèi)地位類似國外的Nuance,那么百度就是國外的Google。類似Google近兩年來頻繁挖語音牛人一樣,百度邀請(qǐng)了吳恩達(dá)加盟,擔(dān)任百度的首席科學(xué)家,負(fù)責(zé)百度研究院,他的研究領(lǐng)域就是機(jī)器學(xué)習(xí)和人工智能,研究重點(diǎn)是深度學(xué)習(xí)(deep learning)。深度學(xué)習(xí)就是神經(jīng)網(wǎng)絡(luò)當(dāng)中非常重要的一個(gè)環(huán)節(jié)。
對(duì)于移動(dòng)時(shí)代的搜索引擎來說,語音的重要性巨大,一旦這個(gè)環(huán)節(jié)落后未來可能直接被淘汰,所以Google和百度如此重視不是沒有道理。像百度2010年就已經(jīng)開始進(jìn)行語音布局,深度神經(jīng)網(wǎng)絡(luò)技術(shù)(DNN),自然語言處理技術(shù)(NLP)以及百度多年的搜索技術(shù)積累,語音技術(shù)進(jìn)入到例如手機(jī)百度這樣的移動(dòng)產(chǎn)品當(dāng)中,成為語音輸入的入口,足可以見重視程度。不過其實(shí)筆者認(rèn)為,除了搜索外,移動(dòng)端一切產(chǎn)品形態(tài)都離不開語音和圖像交互,這源于移動(dòng)本身的屬性,不早點(diǎn)布局語音的互聯(lián)網(wǎng)公司,早晚會(huì)在交互上吃虧。
萬物智能:萬物聯(lián)網(wǎng)時(shí)代到來
200年前,人與人之間依靠飛鴿傳書。10年前我們依靠手機(jī)聯(lián)系,而從2014年開始,我們發(fā)現(xiàn)周圍的一切都逐漸開始可以聯(lián)網(wǎng),無論是家里的空調(diào)、洗衣機(jī)還是外面的道路、公園、機(jī)場。這所有的一切都可以實(shí)時(shí)地將數(shù)據(jù)回傳到系統(tǒng),系統(tǒng)則可以根據(jù)收到的大數(shù)據(jù),實(shí)時(shí)地將它們運(yùn)用到相應(yīng)的場景中,讓你切實(shí)感受到一個(gè)數(shù)字化、智能化的環(huán)境。而這些實(shí)時(shí)數(shù)據(jù)將會(huì)成為未來智能模擬和用戶畫像的最堅(jiān)實(shí)基礎(chǔ)。
而這一些正在慢慢變成現(xiàn)實(shí),通過支付寶我們可以知道自己的支出數(shù)據(jù),消費(fèi)傾向和使用頻次。通過百度搜索我們可以知道自己的喜好、身體數(shù)據(jù)、可以知道我們經(jīng)常在那里使用什么交通工具。而這一切都是基于移動(dòng)互聯(lián)網(wǎng)帶來的集群效果,通過這些數(shù)據(jù)我們就可以完成精準(zhǔn)的用戶畫像,可以模擬用戶的行為習(xí)慣和行為預(yù)判,這將是一件無比令人興奮的事情。
就算你在移動(dòng)端的搜索體驗(yàn),有了實(shí)時(shí)數(shù)據(jù),就可以預(yù)判道路是否堵車,可以知道節(jié)假日景點(diǎn)人流擁擠程度。通過定位系統(tǒng)和用戶餐飲喜好,直接高速附近的美食參觀和排隊(duì)情況。而通過大數(shù)據(jù)挖掘、智能定位等技術(shù)的原生廣告和信息流廣告,基于用戶的需求、興趣推動(dòng),一方面大大降低了干擾用戶產(chǎn)品體驗(yàn)的可能性,一方面大大提高了成交率,同樣革命了廣告行業(yè)。這些都將會(huì)是萬物智能時(shí)代最為普通的應(yīng)用。
是不是感覺有些看起來簡單的產(chǎn)品,背后的邏輯都能勾勒出像科幻電影般的未來?其實(shí)就像開頭筆者所說,未來不是沒來,是一直都在你身邊,就等著哪一天被擊中引爆點(diǎn),突然改變你現(xiàn)在的一切。