(2019-09-10)正式高中科學考試題目,你能答對多少?一個名為Aristo的AI軟體,通過了90%的高一(8年級)、80%的高四(12年級)科學測驗...
(2019-09-10)如果你是高中學生,試著回答這道四選一問題:
「一群組織在一起共同工作完成特別的功能」稱為:
a. 器官 b. 生物 c. 系統 d. 細胞
如果這個問題太容易,再看下一題:
「在一個松鼠群居的地方,讓松鼠數量減少的最大原因」是:
a. 捕捉者的數量減少 b. 松鼠間的競爭減少 c. 食物增加 d. 森林火災次數增加
這是正式的高中科學考試題目,一個稱為Aristo的AI軟體,通過了90%的高一(8年級)、80%的高四(12年級)科學測驗。
對用功一點的學生來說,這些題目並不難,Aristo是AI軟體,對科學知識更是豐富,但問題問的方式並不直接了當,先要解讀題目的文字敘述,對人也許輕而易舉,對電腦則是困難的挑戰。
上述第一題還算容易選答,第二題則要繞個彎子,分析之後才能選答,90%、80%的答對率不是一件容易的事。
四年前舊金山有一個8萬美元的競賽,700位專家試圖製作AI,通過8年級科學考試,結果全軍覆歿,最好的成績還不到60%,在語言能力與邏輯思考上,遠不如剛進高中的學生。
Aristo是西雅圖Allen AI學院發展出來的,不但能解譯自然語言,而且能模仿人類用邏輯抉擇。Allen學院是由微軟共同創辦人Paul Allen於2013年所創建。
學院起初意在研發一個數位的亞里斯多德(Digital Aristotle),所以取名Aristo,但要制訂一個AI標準,不能以下棋或專為機器設計的題目為準,因此決定以紐約標準學生考試的選擇題為主,實際題目有些含有圖表,但為了簡化將之刪除,否則回答問題要結合語言與電腦視覺解譯圖表,增加AI複雜度,刪除圖表後仍能回答的很好。
科學考試不能僅靠學習規則得到好成績,而需要用邏輯來連結,以前面的松鼠題目為例,森林火災的增加,會殺死松鼠,或減少讓松鼠生存與繁殖所需的食物。Aristro能模仿人類的分析答對問題,是突破性的成就,也代表AI正走向AGI(Artificial General Intelligence)通用人工智慧。
所謂通用,簡單的說就是能跟人流暢的溝通,不限領域的有意義對話,這是AI的最高理想,許多專家朝這一目標研究。
說到AGI,就不能不說「圖靈測試」(Turing Test),Alan Turing(1912-1954)是英國數學家、電腦科學家,最為大家所樂道的,是二次大戰破解德國密碼機Enigma,從中獲取情報導致聯軍勝利。
但在科學上他發明了圖靈機器(Turing Machine),用數學模型模擬現代電腦運作,後人尊他為電腦之父,在1950年,他設計了圖靈測試,用來測驗電腦是否有人類的智慧。
圖靈測試很簡單,兩個人與一台電腦分別在三個房間,一個人問問題,另一個人與電腦交錯回答問題,反覆多次問答後,問的人如果有半數(有的說三分之一)無法分辨答案是另一個人、或是電腦回答的,那電腦就算通過測試,也就認為有人類的智慧。
幾十年來有無數電腦專家設計軟體,想要通過這個測試,至今除了在有限度的領域,還沒有任何電腦軟體通過。
Aristo的功能仍屬有限度的領域,專家認為仍無法與學生的理性能力相比,但技術可以推廣用作服務,如網路搜尋與醫院資料記錄。至於提升AI能力如通過GRE(Graduate Records Examination),也就是通過研究所的入學考試,內容分語文與數學推理,在語文上或可以做到,但數學推理則挑戰太高。
紐約時報報導了Aristro的消息,認為機器可以瞭解自然語言並適當回應,在技術上是一個里程碑,同時例舉測驗Aristro的五道試題,讓讀者裁判Aristro的科學程度。
一、細胞的哪一部分結構把養份送到細胞中心?
a. 細胞膜 b. 葉綠體 c. 細胞質 d. 細胞核二、什麼器具最能分開鐵屑與黑胡椒的混合物?
a. 磁鐵 b. 過濾紙 c. 三樑天秤 (triple beam balance) d. 電壓表三、當食物被機械化的消化了,是:
a. 變成另一種元素 b. 絞碎成小塊 c. 轉換成能量 d. 排出體外四、紐約州在一月比三月有更大的機會下雪,是因為北半球:
a. 偏向太陽溫度較暖 b. 偏向太陽溫度較冷 c. 反向太陽溫度較暖 d. 反向太陽溫度較冷五、溫度計裡液體的變動顯示溫度的變化,溫度升高表示液體的分子:
a. 動作慢下來而且凝聚 b. 動作加快而且分開 c. 遇熱收縮 d. 遇熱擴散
本文取材自2019年9月8日「那福忠西海岸數位隨筆(116)」:AI的科學知識升級到了高中
對本文有任何看法,歡迎 E-Mail:frank.na@gmail.com 給作者,分享您對本文的看法。