“聽”和“說(shuō)”是人工智能的兩個(gè)重要入口,無(wú)論是siri這樣的語(yǔ)音助手還是Google的無(wú)人駕駛,都要機(jī)器能聽得懂語(yǔ)音命令,滿足基本的人機(jī)交互。科大訊飛開放平臺(tái)是全球最大的語(yǔ)音和人工智能開放平臺(tái),并且為教育、智能駕駛等領(lǐng)域提供智能語(yǔ)音服務(wù)??拼笥嶏w輪值總裁、研究院院長(zhǎng)胡郁認(rèn)為人工智能和人的智能是兩條不同的發(fā)展路徑,人工智能會(huì)逼近甚至超過(guò)人的智能,但短時(shí)間內(nèi)不會(huì)出現(xiàn)意識(shí)。
我們講人的智能,是一個(gè)包羅萬(wàn)象的概念,人類有視覺(jué)、聽覺(jué),能聽懂語(yǔ)言,還可以下棋,人類可以通過(guò)一個(gè)大腦,實(shí)現(xiàn)這些功能,這是人類的智能,但是人工智能不一樣,它是通過(guò)不同的算法實(shí)現(xiàn)不同的功能,這是二者最大的區(qū)別。
目前,人工智能處于什么階段呢?并不是說(shuō)人所有的智能計(jì)算機(jī)現(xiàn)在都能實(shí)現(xiàn),它是逐步來(lái)的。比如人類一些簡(jiǎn)單的功能,比如邏輯、計(jì)算、記憶等等,計(jì)算機(jī)做得比人還好,這一類被稱之為運(yùn)算智能。
在人工智能出現(xiàn)的這六十年中,這個(gè)行業(yè)一直還處于研究階段,主要研究三個(gè)問(wèn)題:第一個(gè)是用什么方法來(lái)做?第二個(gè)是用什么樣的數(shù)據(jù)?第三個(gè)是人工智能會(huì)有哪些應(yīng)用?
為什么智能語(yǔ)音在2010年左右取得較大突破?首先是因?yàn)樵?006年提出的深度神經(jīng)網(wǎng)絡(luò)技術(shù)逐漸成熟,這是一套神經(jīng)網(wǎng)絡(luò)模型,模擬大腦的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),第二是因?yàn)殡S著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái),數(shù)據(jù)足夠多。
第三是因?yàn)槿斯ぶ悄苓M(jìn)行了商業(yè)化,這對(duì)它的發(fā)展很重要,人工智能發(fā)展的一個(gè)必要條件是有人在使用過(guò)程中不斷給予反饋,幫助人工智能調(diào)整、改進(jìn),這個(gè)人必須是真的人。目前科大訊飛的語(yǔ)音輸入每天有幾億次的使用數(shù)據(jù),計(jì)算機(jī)可以不斷糾正自己,提高正確率,這種使用成本在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)之前是沒(méi)有辦法做到的,那時(shí)候成本太高。
「 人工智能和人的智能實(shí)現(xiàn)路徑不一樣 」
機(jī)器實(shí)現(xiàn)智能的方法,跟人腦實(shí)現(xiàn)智能的方法、途徑是不一樣的,但是二者的目標(biāo)是一樣的,機(jī)器會(huì)用它擅長(zhǎng)的方法去做,這個(gè)是目前實(shí)現(xiàn)弱人工智能技術(shù)上的一條路徑,不管科學(xué)家使用什么樣的方法,計(jì)算機(jī)科學(xué)或者仿生學(xué),都是使用和人腦不一樣的方法實(shí)現(xiàn)相同的效果。
目前人工智能還處于弱人工智能階段,未來(lái)要實(shí)現(xiàn)強(qiáng)人工智能的話,是希望計(jì)算機(jī)能夠自主學(xué)習(xí)、舉一反三。但是目前還在研究階段,沒(méi)有人找到該怎么做。
人工智能目前還處于感知階段,之前是邏輯、計(jì)算階段,那個(gè)階段是以“深藍(lán)”為代表,未來(lái)更高層的階段是認(rèn)知,也就是強(qiáng)人工智能階段。感知層面現(xiàn)在已經(jīng)做得比較好了,比如計(jì)算機(jī)可以比較精準(zhǔn)的識(shí)別圖像和語(yǔ)音,雖然它跟人類做的方法不一樣,但最后的結(jié)果非常好。
感知和認(rèn)知在人的智能上,不是完全分割的。當(dāng)人在聽一個(gè)句子的時(shí)候,其實(shí)大腦里是在進(jìn)行認(rèn)知的,但對(duì)計(jì)算機(jī)而言,這兩步是分開的,而且要逐步實(shí)現(xiàn)。
目前行業(yè)內(nèi)也開始研究計(jì)算機(jī)的認(rèn)知能力,比如科大訊飛研發(fā)的閱卷智能設(shè)備,計(jì)算機(jī)可以給作文打分,這并不是說(shuō)計(jì)算機(jī)已經(jīng)看懂了人類寫的文章,而是在這之前會(huì)存儲(chǔ)人類歷史上大量的文章。計(jì)算機(jī)評(píng)卷的規(guī)則就是找相關(guān)性,在某一個(gè)主題下,是不是會(huì)有固定的幾個(gè)關(guān)鍵詞?比如一篇描寫春天的文章,如果有大量描述冬天的詞匯,那肯定相關(guān)性就會(huì)降低,這就是機(jī)器擅長(zhǎng)使用的大數(shù)據(jù)方法。
智能語(yǔ)音也是這樣。小孩子從出生到聽得懂外界的語(yǔ)言大概需要兩三年的時(shí)間,他有效收聽外界語(yǔ)言的時(shí)間可能連1000個(gè)小時(shí)都不到,但是計(jì)算機(jī)想要達(dá)到同樣的效果,可能要收集10萬(wàn)個(gè)小時(shí)的語(yǔ)音數(shù)據(jù),它聽到的越多,智能語(yǔ)音的準(zhǔn)確性就會(huì)越高。
計(jì)算機(jī)是靠大數(shù)據(jù)的相關(guān)性,人是靠邏輯,二者都可以解決問(wèn)題,方法雖然不一樣,但是最終的結(jié)果是一樣的。從人工智能研究者的角度來(lái)講,他們更關(guān)心人工智能是不是跟人類一樣具有智慧;從應(yīng)用者的角度來(lái)講,更關(guān)心它的結(jié)果,是不是滿足需求。就像AlphaGO一樣,它可以戰(zhàn)勝人類,但是能說(shuō)明它真的會(huì)下圍棋嗎?它并不會(huì),它根本不知道圍棋是什么,但它表現(xiàn)出來(lái)的結(jié)果比人類更好,這才是現(xiàn)在我們講的人工智能的本質(zhì)和精髓。
根據(jù)現(xiàn)在對(duì)計(jì)算機(jī)科學(xué)和仿生學(xué)的研究,可以看出在某些話題下,雙方構(gòu)建的模型有一定的相似度,但是這還不足以證明我們可以按照大腦的模型構(gòu)建出真正的人工智能,相似度只是一個(gè)結(jié)果,但業(yè)內(nèi)還沒(méi)有研究出來(lái)為什么會(huì)出現(xiàn)這樣的結(jié)果。
目前科學(xué)仍然無(wú)法說(shuō)明大腦的工作原理,人是有邏輯的,這主要是由左腦負(fù)責(zé),但是右腦負(fù)責(zé)的直覺(jué)、想象力等很難解釋,目前的科學(xué)也無(wú)法解釋清楚,所以在只有一個(gè)結(jié)果的前提下,沒(méi)有辦法為真正的人工智能提供解決路徑。
這就能夠解釋,為什么弱人工智能可以不斷地取得進(jìn)步,但是這種進(jìn)步是有天花板的,也就是它絕對(duì)不會(huì)自主去學(xué)習(xí),人類要給它數(shù)據(jù),模型也要幫它搭建好,它才可以實(shí)現(xiàn)深度學(xué)習(xí)。
計(jì)算機(jī)跟人的成長(zhǎng)是反著的,比如說(shuō)常識(shí)對(duì)人來(lái)說(shuō)很簡(jiǎn)單,四五歲的孩子基本上就有了足夠的常識(shí),要經(jīng)過(guò)十多年的知識(shí)和邏輯的積累才能夠參加高考,但是計(jì)算機(jī)不一樣,邏輯對(duì)它來(lái)說(shuō)很簡(jiǎn)單,輸入一個(gè)行業(yè)的知識(shí)也不難,真正的難點(diǎn)在于常識(shí),沒(méi)有常識(shí)的支撐,計(jì)算機(jī)的很多知識(shí)和邏輯無(wú)法運(yùn)用,這就是二者路徑最大的區(qū)別。人類一定要知道,將來(lái)機(jī)器人戰(zhàn)勝我們的方法,一定是以它最擅長(zhǎng)的方法,而不是我們想象的方法。
「 人工智能目前不可能出現(xiàn)意識(shí) 」
從地球上生物的發(fā)展可以看到,有意識(shí)的前提是要有智能,沒(méi)有智能不可能產(chǎn)生意識(shí)。但有智能就一定會(huì)產(chǎn)生意識(shí)?這不一定。
人工智能就是這樣,目前的人工智能還看不到意識(shí)產(chǎn)生的任何源泉,意識(shí)是什么?意識(shí)是我知道我是誰(shuí),我知道我在干什么,我知道我要干什么。但目前人工智能的方法都是人類教的,它只是在結(jié)果上表現(xiàn)得和人的智能一樣。人的智能究竟是如何產(chǎn)生的?目前還沒(méi)有研究清楚,當(dāng)人類智能越來(lái)越先進(jìn)的時(shí)候,意識(shí)也會(huì)越來(lái)越強(qiáng),但是當(dāng)我們要用現(xiàn)代的人工智能的方法去做弱人工智能的時(shí)候,并不能保證它越來(lái)越強(qiáng)。
目前人工智能根本不可能產(chǎn)生意識(shí),因?yàn)槿祟惛緵](méi)有研究意識(shí)是怎么產(chǎn)生的,人類目前的研究是如何讓它表現(xiàn)得更像智能一些。但是人的智能和人工智能是完全不同的,人類越智能意識(shí)也就越強(qiáng),但是這一點(diǎn)對(duì)人工智能并不適用,計(jì)算機(jī)是在用擅長(zhǎng)的運(yùn)算和存儲(chǔ)能力來(lái)實(shí)現(xiàn)同樣的效果,因此,人工智能在產(chǎn)生智能的過(guò)程中,看起來(lái)智能的結(jié)果跟人越來(lái)越接近了,但這條路徑不會(huì)產(chǎn)生意識(shí)的。
也就是說(shuō),我們現(xiàn)在所做的所有成功的人工智能跟意識(shí)都沒(méi)有關(guān)系,跟意識(shí)的產(chǎn)生過(guò)程都沒(méi)有關(guān)系,基于大數(shù)據(jù)的這種方法,目前也看不到任何產(chǎn)生意識(shí)的跡象。大家都講人工智能在很多領(lǐng)域戰(zhàn)勝了人類,好像它也會(huì)產(chǎn)生意識(shí)一樣,這是很大的誤區(qū)。
目前人工智能的難點(diǎn)在于很難找到突破點(diǎn),很難讓很多用戶使用,進(jìn)入正循環(huán)的過(guò)程,人工智能必須要有足夠的用戶使用才可以更加準(zhǔn)確。智能語(yǔ)音就是這樣的過(guò)程,一開始是非主流用戶在非主流場(chǎng)景使用,慢慢的一些主流用戶在非主流場(chǎng)景中使用,現(xiàn)在是主流用戶在主流場(chǎng)景下去用它。
語(yǔ)音交互是人工智能的基礎(chǔ)功能,在未來(lái)產(chǎn)業(yè)化的過(guò)程中,我們有幾個(gè)路徑,一種是做技術(shù)支持,把技術(shù)提供給別人;第二種是直接拿技術(shù)去改造一些行業(yè),比如教育等,像目前已經(jīng)做的閱卷機(jī)器人,或者無(wú)人駕駛,科大訊飛可以給終端提供語(yǔ)音系統(tǒng);第三種是做集成性的智能硬件,比如Google在2016年開發(fā)者大會(huì)上發(fā)布的智能盒子Home,這些都是我們可以把技術(shù)提供給別人的途徑。