(2022年12月560期動腦雜誌)AI不再像過往一樣充滿距離感,或是停留在「機器人」的印象。本文《動腦》精選 8 個精彩的日本 AI應用案例,看企業品牌如何善用 AI 優化效率,甚至對人類生活實踐更多關懷。
根據日本普華永道(PWC)集團於 2022年1月發佈的企業AI使用預測調查報告,發現日本企業普遍對AI人工智慧的應用,正朝著非常積極的方向發展。
新興科技的普及,使得AI人工智慧不再像過往一樣充滿距離感,或是停留在「機器人」的印象。事實上,機器學習、AI模型訓練等人工智慧相關的應用,比比皆是。如何運用AI解決人類生活上的問題、提升工作效率,這樣的切入點是所有企業都有機會思考的。
本文《動腦》精選8個精彩的日本AI應用案例,看企業品牌如何善用AI優化效率,甚至對人類生活實踐更多關懷。
AI 監考系統,讓作弊行為無所遁形
無論是高中入學考試、大學入學考試,或是國家資格考試,都偶爾會傳出考生使用手機作弊的狀況。而目前大多數考試現場,仍仰賴監考官目視監控、定時巡場,以防止舞弊發生。不過,這種僅靠少數人肉眼觀察判斷的方式,難免會有盲點,又或是摻雜個人主觀判斷、進而對學生造成誤會的情況。
對此,擅長人工智慧與大數據分析的日本科技公司「User Local」,便運用深度學習,開發出能自動偵測考試作弊的 AI 技術。只需要在考試會場周圍安裝可聯網的監控攝影機,並即時將考場影像上傳,再透過 AI 系統從考生的姿勢、動作、眼睛視線等數據運算,進行影像判斷,即可自動找出疑似出現作弊行為的考生。
運用 AI 偵測作弊行為,不僅可補足人為監考的疏漏,因為有影像紀錄,也避免出現考生被無理懷疑的事情發生,讓考試更趨近公平。而考慮到考生的隱私,此 AI 監考系統也會將未偵測到作弊的考生進行人臉遮蔽,以保護個資安全
AI監考系統
User Local 開發的AI監考系統,可從考生的注視角度、頭部角度、手部動作等異常情況判斷作弊可能。而未有作弊跡象的考生,其臉部則會自動遮蔽以保護隱私。
AI 牙膏配方,獅王牙膏新口味開發時間縮短 20%
牙膏配方,並不是只有薄荷或水果口味這麼簡單而已。事實上,日本獅王(LION)在開發牙膏時,可是需要從500多種原料中挑選香氣與味道,接著摸索出最適當的比例,以打造出市場接受度高、適口性佳,又能帶點新意的牙膏口味。
而在牙膏開發任務中擔任重要角色的風味調配人員,稱作「調味師」。他們必須根據新產品的主要受眾(如不同的性別、年齡客群)或是特定的產品理念,耗費數個月以研發出一種新牙膏口味。
然而,獅王於今年8月正式公開他們的AI計劃,也就是讓AI針對獅王專業開發人員超過100小時的實作經驗、以及過去10年的一千多種配方數據進行機器學習,將人工智慧訓練成一名調味師。當AI模組逐漸成熟後,只要在系統輸入新產品特點,接著AI便會提供至少含有3種香料的牙膏配方,並且包含成分與比例的建議。
AI不只為牙膏開發人員減少反覆試錯、調整的時間,甚至也能預測產品製造流程中可能遇到的問題,例如牙膏質地與包裝的合用性。以往在研究開發階段,幾乎難以預測牙膏本體在包裝中的流動性;往往等到產品做出時,才發現牙膏難以使用,而不得不回過頭來重新考慮配方比例。
而在AI導入材料資訊學(MI,Material Informatics),便能提前預測此類狀況,讓新產品的製造工程能減少40%。這項AI牙膏開發系統,是獅王在2021年成立數位轉型部門「DX 推進部」之後的代表傑作,目的是為了提升新品開發效率,也或多或少引起市場好奇。而獅王也宣布,在未來1至2年內,消費者或許就有機會體驗AI製成的牙膏了。
AI 食譜,從料理影片自動生成烹飪步驟
日本電器大廠歐姆龍旗下專責研發的子公司 OMRON SINIC X,與京都大學聯合開發出一項 AI 技術,讓人工智慧可依據料理影片自動生成食譜。
這項AI技術的開發,首先從1,300支料理影片中分別擷取最重要的10個步驟,再將這些食譜步驟與 AI 編寫的食譜相結合,進而讓AI學習。透過機器學習的訓練,AI即可按照食材,辨識食材外觀在料理過程中的變化,並運用食譜中常用的詞彙,逐步編寫出食譜步驟。
例如在一次實際的演練中,AI 即根據一支炸豬排影片,迅速抓取幾個重要的步驟,接著自動生成「將豬肉裹上麵包粉」、「以平底鍋炸豬排」等文字。
AI 自動生成食譜的技術,未來將有機會廣泛運用於各種流程示範教學;只要讓 AI 熟悉該領域的常用步驟,即可透過影片迅速編寫出流程規範。例如:歐姆龍工廠內的生產製造流程,或是其他產業的 SOP(Standard Operation Procedure)訂定,更有效率的完成技術傳承、人員訓練等工作。
AI 演唱合成技術,「VOCALOID:AI」重現歌姬經典美聲
曾引領日本樂壇風潮,對日本音樂演藝界有著深刻影響力的傳奇歌姬——美空雲雀,在2019年逝世 30週年時,在日本YAMAHA公司與NHK的攜手合作下,運用最新AI科技與4K 3D 投影技術,將逝去的經典美聲與巨星風采,再度重現於觀眾面前,令人驚豔不已。
首先,為了盡可能真實再現美空雲雀的歌聲與演唱風格,YAMAHA開發出AI歌聲合成技術「VOCALOID:AI」,以美空雲雀生前的演唱、說話等錄音素材,作為AI訓練來源,並運用機器深度學習(Deep learning)分析歌手演唱任何語言歌曲的演唱特性,不只重現歌手的音色、音調,也能呈現歌手獨特的唱腔風格、甚至是旋律或歌詞間隙等細微變化。
此外,在本次 NHK 紀念歌姬逝世30週年的特別節目中,也導入4K 3D高畫質全息投影技術,讓真人等比例大小的影像出現在舞台上,彷彿傳奇歌姬再次降臨舞台,獻唱一曲。
值得一提的是,本次演唱的歌曲是日本製作人秋元康特別寫的新歌曲,也就是美空雲雀生前從未演唱過。這使得本次 AI 歌聲模擬、4K 3D影像重現的挑戰性更高。拜現代科技之賜,最終NHK於2019 年9月29日的特別節目中順利再現美空雲雀的表演,而「VOCALOID:AI」首次公開應用的成功,也令人期待更多傳奇經典的重生可能。
AI 廣告文案,未來的廣告內容將能即時自動生成?
廣告文案的生成,仰賴創作者對市場需求的洞察、對人類心理的理解,以及對文字的掌握度。AI人工智慧有可能製作出打動人心的廣告文案嗎?對此,日本電通廣告公司為提升文案生成效率,利用人工智慧開發了廣告文案生成系統——「AICO」(AI Copy Writer),或許有機會解答。
首先,日本電通為了AI廣告文案技術已經進行了大約五年的研究,並對「廣告文案的品質如何影響廣告效果」進行多方評量。接著進入技術開發階段後,日本電通與靜岡大學信息學部共同開發出「AICO」系統,除了運用大量的文案廣告作為AI學習素材,也讓實際的文案創作者投入研究開發,讓「AICO」的文案盡可能接近人類的創意。
事實上,電通開發AI廣告文案最主要的目的之一,是希望能讓廣告內容有機會依據「TPO」(也就是 Time時間、Place地點、Option時機)進行即時改變,讓廣告更靈活、更精準、更有效。在數位廣告、程序化廣告當道的今時今日,這項新技術很有機會為廣告傳播領域帶來新變革,令人拭目以待。
AI 語音導覽,讓視障者也能體驗逛街的樂趣
「櫥窗購物」(Window shopping)是一種很省錢的逛街方式,意思是不特別買什麼東西,就只是在商街隨意地邊走邊看,欣賞商家櫥窗裡的擺設,看著琳瑯滿目的最新商品,透過一飽眼福的方式享受逛街。
可惜的是,視障人士並無法直接體驗櫥窗購物的樂趣。在日本,約有超過 160 萬視力障礙者。為了讓視障者也可以享受逛街、享受購物的過程,日本電通團隊開發了一款名為「LISTENING WINDOW」的 App,讓視障人士,甚至是高齡長輩、幼年兒童,或是語言不通的外國人,都能透過這款工具自在的外出逛街。
「LISTENING WINDOW」主要利用iPhone的光學雷達( LiDAR)功能,用以判斷手機到物體的距離,並識別物體的形狀。同時,也導入AI的圖像識別技術,讓手機鏡頭能為使用者扮演「眼睛」的角色。例如:視障者可在脖子上掛著手機走動,接著「LISTENING WINDOW」的AI系統會識別商店名稱,並提供語音導覽功能說明商店資訊。若使用者對商店有興趣,即可點擊手機螢幕,以獲取更多商家訊息、產品推薦、促銷資訊等內容。
一對視障夫妻在試用「LISTENING WINDOW」後表示肯定。例如:太太日向舞香從中學開始逐漸失去視力,僅剩非常微弱的弱視功能,而使用「LISTENING WINDOW」能讓她能在沒有旁人幫助的情況下獨自享受購物;先生日向賢則是先天性全盲者,能藉由這款工具知道平時常去的商店之外,原來還有很多其他店舖可以認識,他對此感到很有趣。
除了扮演視障人士的雙眼、提供語音導覽,「LISTENING WINDOW」還有更多應用的可能性。例如運用在大型商城、大型車站、旅遊區等公共場所,為高齡長輩、外國觀光客提供設施語音導覽,讓人人都可享有自由自如的行動。
LISTENING WINDOW
「LISTENING WINDOW」利用iPhone的光學雷達(LiDAR)功能,可判斷物體距離與形狀,且具備 AI 的圖像識別技術,讓手機鏡頭能為使用者扮演「眼睛」的角色,並提供語音導覽功能說明商店資訊。
AI 姿勢診斷,一分鐘提供姿勢矯正報告
現代人有許多姿勢不良的問題,由於久坐辦公室的工作型態,長時間使用電腦、或是低頭滑手機等習慣,導致肩頸、腰部、膝蓋等有僵硬或痠痛等症狀。長期姿勢不良,嚴重者還可能會帶來頭痛、睡眠品質變差等身心失衡等負面影響。除了對健康造成衝擊,姿勢不良也會帶來不好的印象,尤其在正式場合或商業情境中,不正確的姿勢,也會帶來較不好的形象觀感。
為了導正人們的姿勢,藉此改善體態與重拾活力,日本人工智慧開發企業Otafuku Lab與大阪大學數學與數據科學中心合作開發了一款名為「Posen」的AI工具,只要運用iPad拍照上傳使用者姿勢,Posen系統即可在短時間內對使用者的姿勢進行診斷和評分,並提供改善建議。從拍照到姿勢診斷結果出爐,僅需要一分鐘的時間。而診斷結果和建議可列印出來,或是下載電子檔保存。
Posen的應用除了幫助忙碌的醫師、物理治療師做初步的診斷,也可為企業作為員工教育訓練的工具。例如注重員工素養的飯店業者,即可運用Posen為員工做評量,並提供導正姿勢的建議,讓服務人員優化整體儀態,帶來專業有活力的形象。
同時,Posen也可為高齡長輩提供復健指南。讓AI讀取使用者的關節數據,如姿勢是否變形、或是活動範圍等數據,透過直觀的數值與分析圖像,讓長輩一目瞭然身體機能。此外,也可提供復健目標,讓長輩保有持續治療的動力,逐步恢復健康狀態。
此外,Posen也配備管理系統,可記錄使用者的姿勢報告與健康狀況,以此作為定期診斷、持續追蹤的工具。
輕鬆身體檢測
用 iPad 拍攝身體姿勢,15秒內AI即可進行骨骼分析、姿勢分析、關節活動度分析、運動功能檢測等。
AI 手語翻譯系統,打破聽覺障礙的溝通藩籬
根據日本厚生勞動省(衛生部)統計,日本約有35萬名聽覺障礙人士,其中約有14%的人使用手語;即使聽力並未完全喪失,也會使用手語作為溝通工具。然而,日本卻僅有4,000名手語翻譯員(約佔聽障者人數的1%),很難滿足所有手語翻譯的要求。
為了解除人與人之間的溝通障礙,讓聽人與聽障者可以交流,日本電信與媒體通訊業者 Softbank 開發了一款名為「SureTalk」的應用程式,透過AI實現手語和語音談話之間的相互交流。
SureTalk 有網頁版和 iOS App 兩種版本可免費使用。使用者只需註冊SureTalk,點擊「開始對話」按鈕,接著選擇自己喜歡的語言模式(手語或是語音),接著進入聊天室即可。在SureTalk的系統中,AI會透過視訊通話設備觀察用戶的身體動作,並擷取手語特徵、辨識手語,接著將其轉換為文本,讓聽力正常的人得以透過AI手語翻譯理解聽障人士的訊息;同時,聽人也可以直接說話,AI便可即時辨認音訊,轉換為文字訊息給對方。
在這整個AI手語辨識、語音辨識、轉換文本的過程裡,主要運用了三種技術。其一,是「手語辨識技術」,利用深度學習追蹤使用者的動態動作,讓用戶不必侷限於顏色單調的衣服、綠幕背景,或必須使用深度傳感器等特殊條件,即可在一般日常環境中,辨識影像中的手語內容。
其二,是「自然語言處理技術」,讓AI進行手語單詞與日語單詞的對應,包含日語文法中的動詞、助詞、助動詞等,透過翻譯模型訓練,讓AI在手語辨識後,可以將單元手語表達的詞序,轉換為正確的日語詞序,呈現出更自然、精確的日文語句。
其三,則是「語音處理技術」,就是類似聽打的語音辨識功能。當聽力正常者發出的語音訊息時,即可透過AI即時轉換為逐字文本。Suretalk收集了各種環境下的語音數據,例如嘈雜環境、有背景音樂的環境等,以此來訓練AI聲學模型,提高現實生活環境中的語音識別準確率度。
隨著愈來愈多人使用 SureTalk,AI便可透過機器學習提升手語識別的準確性,打破聽覺障礙的藩籬,實現人與人之間更順暢的交流。
訊息轉換器
日本電信與媒體通訊業者Softbank開發了一款名為「SureTalk」的應用程式,使用者只需註冊 SureTalk,點擊「開始對話」按鈕,選擇手語或是語音,便可利用AI將手語或語音轉換為文字訊息、達成溝通。