(2018-01-04)機器學習已是現在進行式,當其發展成 AI,終究會對我們造成影響,但機器到底能學會什麼?
(2018-01-04)機器人(Robot)行動笨拙,除了製造業的專用機器手臂,機器人的動作遠不如人類靈敏,是因為機械操演不夠靈活。但機器學習(Machine Learning, ML)則是另一個領域,是人工智慧 AI 的核心技術,不需要機械的操演,但能學習人類相當多的技術,甚至替代人類的工作。
一旦機器人的機械操演技術進一步進展,也就會學到一些人類日常生活的動作,當然這也要用機器學習產生的 AI 做為腦子。所以機器學習 ML,恐怕不是一個機器人坐在書堆上,一本本的讀。
上個月《科學》(Science)雜誌有一篇報導,探討機器學習的特性與功能,有些領域機器可以學的非常好,這領域的工作遲早會被機器替代,但有的領域機器卻學不了,在這些領域人類仍然主導。
目前的機器學習主要是用電腦模擬的神經網路,模仿我們思考的方式,然後用大量的資料(大數據)來訓練,增進智慧,訓練結束之後,就成為一個 AI 軟體。當然這句話的解釋過於簡單,實際上用電腦軟體模仿我們腦神經的運作,適用性仍有爭議,這只是目前的技術。
機器雖然不同於人類,但學習的情形有類似的地方,比如從病歷診斷哪一種疾病發生的機率,從貸款申請預測未來償還的機率,這些都是醫師與理財專家天天做的事,但機器可能比人做的更快更好,因為因果關係、也就是輸入與輸出的連結,定義清楚,適合機器的學習運算。
機器學習不單靠規則,還要靠經驗資料來訓練,越多的資料、學習的越精準,大數據的概念就用到這裡。大數據可來自監測網路的交易與互動,人工加註分類整理,或針對特定問題製作的模擬,但數據來自非結構化的來源,像是網路聊天,可能產生偏差,機器學習的結果也難免偏頗。另外,靠數據訓練,並非適合所有的領域。
最有意思的是,只要有明確的目標,甚至不必知道達到目標的最好方法,只要運用整理好的數據來訓練,機器的學習效果就特別好。這種方式通常用在系統層面的宏觀領域,像是讓公司獲取最大的利潤,讓市區的交通流暢無阻,而不是用在細微枝節上,因為枝節的數據範圍太窄,難免有錯。
另一個有意思的是,機器是不講理的,學習得到結果,卻說不出演繹的道理,醫師能從病歷耐心的解釋診斷的結果,但機器的解說顯然不如醫師。這正說明了電腦模擬與人的思維運作不同,神經網路從輸入到輸出可能有很多層次,每一層次運算出多項結果傳遞給下一層,這些中間結果並不做他用,所以我們看到最終結果,卻看不到中間過程。
機器學習的算術法,都是用統計與或然率求得答案,學的再好,一旦用到 AI 解決問題,都沒有100%的肯定答案,也就是仍然有出錯的機會,如同最好的人類專家一樣,我們用 AI 解決問題,要把容忍出錯放在心上。
綜合機器學習的特性,需要大量資料,定義嚴謹的輸入與輸出連結,使用統計與或然率,不能發展出單一的最佳答案,不能做清晰解釋。機器「受困」於電腦模擬的神經網路,缺乏人類的適應性,不能突然改變。
所以底線是,許多工作難以自動化,至少要比傳說的來得慢。但仍不能掉以輕心,機器學習發展成 AI,終究會對我們造成影響,在不同的領域,以不同的程度替代我們的工作。
值得注意的是,機器學習也不斷的在「學習」,學習能力一天天提升。
連結:
機器能學會什麼?
*本文取材自2018年1月4日「那福忠西海岸數位隨筆(34)」:機器能學會什麼?
對本文有任何看法,歡迎 E-Mail:frank.na@gmail.com 給作者,分享您對本文的看法。