管理培訓(xùn)
管理培訓(xùn)_*_ |信匯中正領(lǐng)導(dǎo)力

AlphaGo和機器直覺的局限

當(dāng)前位置:
AlphaGo和機器直覺的局限

隨著Google的人工智能程序AlphaGo以4比1大敗南韓圍棋棋圣李世石(Lee Sedol),簡單的結(jié)論是:人工智能(AI)在對抗人類上已達到另一個里程碑,提高了人類的恐懼,擔(dān)心機器最終可能取代員工,甚至經(jīng)理人。但是,AlphaGo雖然以令人信服的方式獲勝,它已透露,人工智能仍然有一些缺失,特別是在涉及機器的直覺時。

Google在2014年以五億美元收購了AlphaGo的開發(fā)者DeepMind,以擴大其蓬勃發(fā)展的人工智能投資組合。AlphaGo的深度學(xué)習(xí)演算法,借助「走棋網(wǎng)絡(luò)」( “policy network” )和「估值網(wǎng)絡(luò)」(“value network”),不僅儲存了名人賽過往數(shù)百萬個棋局,也儲存了它和自己對奕的妙招。這兩個網(wǎng)絡(luò)的命名,聽起來有管理的意味,而且是以提高效率為目的,不單是為了提升電腦的原始計算能力?!缸咂濉梗ā眕olicy’’)有助于縮小最有可能獲勝的每一手的廣度;而「估值」(“value”)借著評估棋局尚未結(jié)束時每個位置的獲勝者,從而降低了搜索的深度。在定義良好的棋賽中的規(guī)則設(shè)定,限制搜索是很有道理的。

但是,在管理者所處的環(huán)境下,對競爭規(guī)則的管制較少,更重要的是,就利害關(guān)系來說,每個結(jié)果并不相等。換句話說,在商業(yè)上,要緊的不只是你輸或贏,也包括輸贏多少。在第三局比賽中,這種對人工智能的限制變得很明顯,AlphaGo沒有增加它的優(yōu)勢,反而下了「悠閑的幾手」( “l(fā)eisurely moves.”)。在圍棋方面,每場棋賽都是獨立的。AlphaGo只關(guān)心贏得那場特定的比賽。不過,在商業(yè)上,你成功的重大幅度,可幫助你在后續(xù)的比賽中保住你的機會。如果你的競爭對手處于下風(fēng),你可能會想讓他永遠無法翻身。

人們以為AlphaGo擁有的另一個優(yōu)勢,是它的時間管理,其實那是限制。AlphaGo安裝了一個特殊的演算法,以便它在下每一手時,所花的時間相同。這個功能的好處是,AlphaGo可避免耗盡比賽規(guī)定的時間,而且不會在終局階段操之過急。這和棋圣李世石形成鮮明的對比,他會在整個比賽的策略性關(guān)鍵時刻,多花幾分鐘。在AlphaGo唯一嘗到敗績的第四局,其致命的一手使用了同樣「有效率」的時間。事后來看,更多的分析可能會讓AlphaGo走到較安全的位置。在商場上會有這種時候:例行的商業(yè)決策可以很快作出,但在公司面臨后果影響深遠的新狀況時,需要花較多時間去思考如何適應(yīng)及因應(yīng)。人工智能需要較多時間去發(fā)展這個層級的判斷。

最后,想一想AlphaGo的自我訓(xùn)練演算法。盡管AlphaGo擁有千年以上的人類下圍棋的知識,它的失敗歸因于一個失誤,當(dāng)下它被打了個措手不及:李世石下了出人意外的一手。更糟的是,AlphaGo的回應(yīng)不佳,而且直到下了許多手后,才意識到那個失誤。內(nèi)部的學(xué)習(xí),無論是在公司或在產(chǎn)業(yè)層面上,可能有它的局限性,尤其是在今日的分享經(jīng)濟和聚合經(jīng)濟內(nèi)。但是,新狀況需要新解決方案,那是在古老的策略書上不一定能找到的。經(jīng)理人經(jīng)??粗渌胤?,例如面臨演算法問題的不同產(chǎn)業(yè),希望找到獨特的解決方案。此外,即使人類可能比機器容易犯錯,我們的優(yōu)勢就在于,有能力承認自己容易犯錯并加以改善,正如李世石的做法。等到AlphaGo發(fā)現(xiàn)自己的錯誤而要修正路線時,為時已晚。

人工智能的定義,往往是將人類思想改善到盡善盡美。但正如李世石所言,落敗的是他,「不是人類」,定義人類的,可能是我們在不完美中的謙遜和復(fù)原力;如果人工智能真的對經(jīng)理人構(gòu)成威脅,這些素質(zhì)仍然有待培養(yǎng)。

成就高成效,實現(xiàn)管理能力快速提升,12Reads系列管理培訓(xùn)教材限時特惠! 立即購買 PURCHASE NOW