2012 年智能手機(jī)出現(xiàn)后,短短幾年內(nèi),國(guó)內(nèi)就涌現(xiàn)一分二網(wǎng)線轉(zhuǎn)接頭的正確使用了一大批語音相關(guān)的公司,像云知聲、思必馳、科大訊飛,發(fā)展都非常迅速,很快進(jìn)入了公眾的視野。這也得益于手機(jī)這個(gè)智能終端的發(fā)展,使得語音成為手機(jī)上的一個(gè)重要應(yīng)用。
“人工智能”是現(xiàn)在流行的話題,但是,如何利用人工智能賺錢你知道嗎一分二網(wǎng)線轉(zhuǎn)接頭的正確使用?在 2015 年,我們依然認(rèn)為語音是一個(gè)非常好的投資機(jī)會(huì)。原因有以下兩點(diǎn):首先,雖然在過去的兩到三年里,人工智能的發(fā)展使得語音技術(shù)取得了很大進(jìn)步,但我們發(fā)現(xiàn)實(shí)際準(zhǔn)確率仍然不夠高——雖然大家根據(jù)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行宣傳,說準(zhǔn)確率達(dá)到了 95% 以上或者更高,但實(shí)際情況是,在實(shí)際使用時(shí)并沒有那么高。
拋開算法和技術(shù)方面不談,前端的很多問題我們還沒有解決。我打個(gè)最簡(jiǎn)單的比方:過去我們討論的語音識(shí)別技術(shù),有點(diǎn)像人類的大腦——在聽到聲音之后,我們?nèi)绾芜M(jìn)行翻譯,或是怎樣把它變成大腦可以理解的信息。但實(shí)際上,關(guān)于耳朵的問題我們還沒有解決——如何排除噪聲干擾?如何在多人講話的時(shí)候會(huì)聽清想聽的內(nèi)容?如何在距離較遠(yuǎn)時(shí)分別聲音的方位?前端的語音/聲學(xué)交互的很多問題如果得不到解決,整體的體驗(yàn)始終不夠好。
第二點(diǎn),從數(shù)據(jù)上看,蘋果上語音搜索的使用率其實(shí)并沒有那么高,原因在于,手機(jī)雖然不是鍵盤的,但觸屏的體驗(yàn)還是很好的。發(fā)展的前景在于智能硬件:在手機(jī)之后,大量智能終端的爆發(fā),包括家居、車載、可穿戴設(shè)備、機(jī)器人等,這些智能終端上的鍵盤——或者說手指就變得更加不重要以及不友好,而語音則變得更加友好和重要。
基于以上兩點(diǎn),我們認(rèn)為,語音技術(shù)還會(huì)有更多發(fā)展和進(jìn)步。
關(guān)于語音技術(shù),大家其實(shí)一直都面臨一個(gè)問題,就是怎么賺錢?科大訊飛 20 多億的收入,其中絕大多數(shù)是鋪網(wǎng)線和做項(xiàng)目工程,前沿科技類的東西其實(shí)是沒有賺到錢的。
在線上,我們本來可以提供 API 賺錢,但后來百度免費(fèi)了,那其他人也只能免費(fèi)了。做 APP 去對(duì)接服務(wù),大家會(huì)覺得手機(jī)上的用戶習(xí)慣、行為習(xí)慣還沒建立起來。所以我想問就這個(gè)很實(shí)際的問題聽聽大家怎么看。
這個(gè)問題很好,也很難回答。對(duì)思必馳來說,我們現(xiàn)在是在考慮怎樣把錢燒掉,并沒有考慮怎么賺錢這件事,這件事情確實(shí)是比較難。
現(xiàn)在其實(shí)大家能夠看到,從 PC 和互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng)、再到其他,語音很可能是一個(gè)方向。語音作為一個(gè)便捷的交互方式之一,隨著智能硬件設(shè)備的迭代更新,它有可能會(huì)成為替代觸屏的交互模式。這也是為什么資本和技術(shù)都聚焦在這一塊,使得人工智能的一個(gè)小春天在寒冬中誕生。
賺錢這件事情,目前我們確實(shí)看不清。
但是圍繞著這個(gè)方向,我們可以看到一些大方向:一個(gè)是核心技術(shù)以及產(chǎn)品體驗(yàn)的提升,這是必須要做的。第二個(gè)則是,我相信大部分公司,在未來肯定會(huì)有一筆相對(duì)不多也不少的技術(shù)授權(quán)費(fèi)之類,雖然這部分不足以滿足資本需求。
然而我仍舊相信,未來無論是 2C 也好、2B 也好,在這個(gè)環(huán)節(jié)上大家都在探索。這條路徑是曲折的,但方向一定是正確的。
我先簡(jiǎn)單介紹一下祥峰投資,我們是新加坡淡馬錫旗下的 VC,主要關(guān)注消費(fèi)和技術(shù)領(lǐng)域的中早期投資,在人工智能方向投資了地平線、Maxent 等。下面我從投資方的角度簡(jiǎn)單談一些看法。
要看怎么賺錢,最主要的是找到需求在哪。在看了這么多創(chuàng)業(yè)項(xiàng)目后,我們會(huì)思考在中國(guó)的消費(fèi)生態(tài)下,那些賺錢的公司是怎么來的?其實(shí)核心是抓住用戶的真正的需求點(diǎn),從需求點(diǎn)出發(fā),考慮怎么樣去做產(chǎn)品,然后追溯到你的上游,再到頂層甚至是芯片,找到哪里有機(jī)會(huì)。
首先,在手機(jī)端,語音作為輸入方式是有需求的,但剛才大家都說,現(xiàn)在如今只是在手機(jī)上做一個(gè)語音識(shí)別的技術(shù),提供一個(gè)輸入的方式,希望通過輸入法建立 APP 來收費(fèi),顯然這在今天已經(jīng)是不太可能的事情了——現(xiàn)在,沒有一個(gè)類似百度輸入法這樣鍵盤輸入的 APP 還是收費(fèi)的。
即便語音是不一樣的輸入方式,但想要收費(fèi)還是很困難的,特別是當(dāng)大佬們都已經(jīng)在做的時(shí)候了。這個(gè)時(shí)候,就要找到一個(gè)需求場(chǎng)景,并且上面沒有其他方案可以和你競(jìng)爭(zhēng)——一個(gè)語音可以扮演重要角色的場(chǎng)景。
比如智能家居中的音箱,就是一個(gè)很好的例子:你不可能在音箱上去觸摸,也很難用其他鍵盤去輸入。因此,如果你找到一個(gè)和音箱產(chǎn)生交互的方式,那么顯而易見你就是最好的,因?yàn)闆]有其他強(qiáng)有力的替代者。
再說汽車。其實(shí)汽車?yán)锩妫嗄陙泶蠹沂褂玫男o、按鍵,本身是一個(gè)非常好的人機(jī)交互方式——它未必比語音輸入的效率低,反而效果很好,因?yàn)槟憧梢宰龅矫げ僮?。設(shè)想一下,在車?yán)锩嫖乙獡Q電臺(tái)的時(shí)候,我不用看中控,就可以摸到旋鈕去操作,或者在方向牌上有一個(gè)旋轉(zhuǎn)的輪子,可以讓我調(diào)整音量之類,這已經(jīng)是最好的人機(jī)交互方式了,而通過語音增大音量或是切換頻率,則未必能更加直接和準(zhǔn)確。
但是,在車中還有很多旋鈕無法解決的其他需求。比如。后排的一客需要和車發(fā)生交互——現(xiàn)在很多車都有后排獨(dú)立的空調(diào)系統(tǒng),當(dāng)乘客覺得后排的溫度太低了,希望空調(diào)調(diào)高一點(diǎn)的時(shí)候,現(xiàn)在的情況是只能讓駕駛者把后排的空調(diào)調(diào)一調(diào),或者后排有自己調(diào)整的方式,但它未必是自動(dòng)的方式。
如果能夠做到,通過一個(gè)很好的語音識(shí)別的陣列工具,很好的分辨出不同乘客的方位,到底是在主駕、副駕,還是后排的左邊或右邊,根據(jù)他們發(fā)出的語音指令滿足不同人的需求,就能產(chǎn)生一種新的交互方式。除了空調(diào),還有的需求比如切換一個(gè)電臺(tái)、換一首歌,等等。
那么從產(chǎn)業(yè)鏈上游來看,這么多年,芯片一直都是一個(gè)可以賺錢的事情。在語音識(shí)別這一塊,做語音的處理芯片,比如 iPhone 使用的 Cirrus Logic,在語音處理這一塊的算法做得非常好,它解決了語音降噪、方位識(shí)別上的關(guān)鍵問題。有了芯片作為載體,就可以基于傳統(tǒng)芯片的商業(yè)模式去掙錢。
Cirrus Logic 推出的 CS44130 可以為整個(gè)音頻信號(hào)鏈提供芯片,包括模擬或、數(shù)字輸入和揚(yáng)聲器喇叭輸出之間的各個(gè)部分。它精小的設(shè)計(jì)可以大大簡(jiǎn)化產(chǎn)品的設(shè)計(jì)。
往下走,在芯片的下游,模塊也有賺錢的機(jī)會(huì),就像今天聲智科技在做的事情一樣。如今的產(chǎn)業(yè)鏈分工是非常細(xì)的,很難再有像過去的飛利浦、西門子這樣的大公司,核心的部件、全器件的研發(fā),一直到最終的產(chǎn)品都是由一家公司來做。在分工很細(xì)的情況下,芯片公司不可能再去做一個(gè)產(chǎn)品,也很難再去做一個(gè)模塊,中間其實(shí)需要的是一個(gè)做陣列的公司:把產(chǎn)品以一個(gè)模塊的形式提供,同時(shí)不僅僅做一個(gè) PCB 板把芯片放上去,而是把算法結(jié)合在里面,體現(xiàn)出附加值。
最后,生產(chǎn)用戶真正使用的一些產(chǎn)品也有賺錢的機(jī)會(huì)。比如類似于 Echo 這樣的終端產(chǎn)品,京東和訊飛也在做,之前也有一些創(chuàng)業(yè)公司在做。不過,真正有機(jī)會(huì)的創(chuàng)業(yè)公司是能夠去開拓一個(gè)新的市場(chǎng)領(lǐng)域的。就音箱來說,這是一個(gè)長(zhǎng)期存在的行業(yè)和產(chǎn)品,那么,可不可以創(chuàng)造出一個(gè)新的產(chǎn)品形態(tài)?在這方面,創(chuàng)業(yè)公司往往擁有更大的機(jī)會(huì),比如大疆在無人機(jī)領(lǐng)域能做到今天的體量,是因?yàn)樗耆_創(chuàng)了一個(gè)新的產(chǎn)品品類。
比如說機(jī)器人,雖然現(xiàn)在大家還沒有普遍使用機(jī)器人,但是它一定是一個(gè)趨勢(shì)性、未來性的東西。在家庭場(chǎng)景中,使用最為廣泛的其實(shí)是掃地機(jī)器人。很多人買了一段時(shí)間就未必再用掃地機(jī)器人了,其中有各種各樣的原因,可能掃得不夠干凈,也有它不夠智能的原因——它是在完全沒有規(guī)劃路徑地在亂掃。如果現(xiàn)在我們能夠加入更多智能的東西,包括語音的交互,它就有可能成一個(gè)真正的智能機(jī)器人。你可以呼喚它:“掃地機(jī)器人,到我這里來,把這個(gè)房間打掃一下?!?而不是拿一個(gè)搖控器操作,或者走過去把它提過來。你的聲音傳遞給他,他就知道你的方位,就會(huì)自動(dòng)朝你的方向走,這也是一個(gè)可以提升用戶體驗(yàn)的方向。
為什么會(huì)說語音技術(shù)賺不到錢?其實(shí)是一開始沒搭建好商業(yè)模式。剛開始提供云識(shí)別,是 to VC 的模式,強(qiáng)調(diào)的是公司的品牌影響力。那一旦開了免費(fèi)的口子,之后就無法再收費(fèi)了。
我們現(xiàn)在希望能先把 “蛋糕做大了” ,之后怎么分蛋糕大家再商量。但現(xiàn)在整個(gè)市場(chǎng)還沒有起來,所有做語音技術(shù)的都在燒錢。
聲智科技的起步有點(diǎn)特殊:它一開始就做硬件,大家看到很多的展示的產(chǎn)品,有我們授權(quán)的,也有我們自己的,都可以讓我們從硬件中直接得到收入,相對(duì)來說,我們最初的商業(yè)模式是非常簡(jiǎn)單的。
但就像剛才我說過的一樣,這個(gè)是有問題的。光看硬件,是不足以吸引公司對(duì)我們的定義產(chǎn)生理解的,我們很難再做一個(gè)大規(guī)模的公司,這個(gè)時(shí)候,我們對(duì)硬件加軟件后端的理解就和訊飛產(chǎn)生了一些差異,我們并不把語音交互只看作一個(gè)輸入法,也就是說,我們把它定義為類似于其他的操作方式的升級(jí)。我們把它看作搜索的升級(jí),也就是讓語音交互可能成為下一代的搜索。而我們現(xiàn)在做的是現(xiàn)代搜索的一個(gè)入口,有點(diǎn)像以前的瀏覽器和后面的百度、谷歌之類??赡芪艺f得比較大一點(diǎn),就是將我們?cè)鹊慕换シ绞缴?jí)。
我們回想一下,在 PC 端時(shí)代,我們用得比較多的是谷歌和百度。那個(gè)時(shí)候,我們要打開瀏覽器、輸入內(nèi)容,再去查找網(wǎng)頁,但是到了移動(dòng)互聯(lián)時(shí)代,用手機(jī)時(shí)我們會(huì)發(fā)現(xiàn),在手機(jī)上,我們很少去打開一個(gè)瀏覽器,打開百度、谷歌,再去搜索內(nèi)容,至少頻次明顯比原先在 PC 上的頻率小很多。現(xiàn)在,我們已經(jīng)更習(xí)慣打開 APP ——實(shí)際上,通過 APP 的形式,搜索已經(jīng)被折疊化了。
我們現(xiàn)在知道,谷歌和亞馬遜對(duì)智能音箱很感興趣。提到智能音箱,我們又會(huì)發(fā)現(xiàn),當(dāng)我們面對(duì)沒有屏幕的音響是,你就不會(huì)去輸入或者打開 APP 了——也就是把搜索進(jìn)一步折疊了,折疊的結(jié)果是,你去直接問它,這個(gè)效率明顯比前兩個(gè)的效率更高。實(shí)際上,這些都是由人性決定的——人的本性就是,喜歡向著簡(jiǎn)單、高效去發(fā)展。
這個(gè)時(shí)候我們會(huì)發(fā)現(xiàn),語音會(huì)改變未來搜索的狀態(tài):現(xiàn)在的小朋友如果適應(yīng)了智能音響的交互方式,很多時(shí)候他就會(huì)直接提問,而不是打開 APP,或者像 PC 時(shí)代一樣,輸入很多需要查找的信息。
我們現(xiàn)在有一些微薄的收入,但是以后我們?cè)诶锩嬖鯓幽軌虍a(chǎn)生更好的方式,對(duì)我們來說,就是硬件+芯片,這在以后會(huì)產(chǎn)生更好的營(yíng)收。移動(dòng)端有很多 AP、很多的巨頭,但是這到底能產(chǎn)生一種什么樣的新的商業(yè)模式,可能還都是在探討和摸索中。
現(xiàn)在很多巨頭,不用考慮營(yíng)收,所以它們會(huì)盡量去做。對(duì)我們來說,只能先有硬件,然后下一步加輕量的方式,維持公司正常的商業(yè)運(yùn)轉(zhuǎn),然后下一步,看看會(huì)不會(huì)像我們預(yù)想的一樣,語音能夠下一代的搜索入口、甚至發(fā)生入口大戰(zhàn),然后形成新的商業(yè)模式,能夠改變我們很多的行為習(xí)慣。這就需要各方面去探討和摸索,甚至還會(huì)掉進(jìn)很多坑。
我相信第一波會(huì)有很多家公司做進(jìn)去,因?yàn)榇蠹医?jīng)常說,第二波公司會(huì)做得很好,每個(gè)時(shí)代的發(fā)展都經(jīng)常出現(xiàn)這樣的情況。關(guān)于定位,我們也不敢說什么,只是先給大家提供完整的解決方案,不管是機(jī)器人、智能音響、車載,我們都更希望,大家共同開拓這個(gè)市場(chǎng)。同時(shí),我們本身也是非常開放合作的。
評(píng)論列表
還沒有評(píng)論,快來說點(diǎn)什么吧~