原來AI這麼近！充滿日常實用性的AI應用

（2022年12月560期動腦雜誌）AI不再像過往一樣充滿距離感，或是停留在「機器人」的印象。本文《動腦》精選 8 個精彩的日本 AI應用案例，看企業品牌如何善用 AI 優化效率，甚至對人類生活實踐更多關懷。

根據日本普華永道（PWC）集團於 2022年1月發佈的企業AI使用預測調查報告，發現日本企業普遍對AI人工智慧的應用，正朝著非常積極的方向發展。

新興科技的普及，使得AI人工智慧不再像過往一樣充滿距離感，或是停留在「機器人」的印象。事實上，機器學習、AI模型訓練等人工智慧相關的應用，比比皆是。如何運用AI解決人類生活上的問題、提升工作效率，這樣的切入點是所有企業都有機會思考的。

本文《動腦》精選8個精彩的日本AI應用案例，看企業品牌如何善用AI優化效率，甚至對人類生活實踐更多關懷。

AI 監考系統，讓作弊行為無所遁形
無論是高中入學考試、大學入學考試，或是國家資格考試，都偶爾會傳出考生使用手機作弊的狀況。而目前大多數考試現場，仍仰賴監考官目視監控、定時巡場，以防止舞弊發生。不過，這種僅靠少數人肉眼觀察判斷的方式，難免會有盲點，又或是摻雜個人主觀判斷、進而對學生造成誤會的情況。

對此，擅長人工智慧與大數據分析的日本科技公司「User Local」，便運用深度學習，開發出能自動偵測考試作弊的 AI 技術。只需要在考試會場周圍安裝可聯網的監控攝影機，並即時將考場影像上傳，再透過 AI 系統從考生的姿勢、動作、眼睛視線等數據運算，進行影像判斷，即可自動找出疑似出現作弊行為的考生。

運用 AI 偵測作弊行為，不僅可補足人為監考的疏漏，因為有影像紀錄，也避免出現考生被無理懷疑的事情發生，讓考試更趨近公平。而考慮到考生的隱私，此 AI 監考系統也會將未偵測到作弊的考生進行人臉遮蔽，以保護個資安全

AI監考系統
User Local 開發的AI監考系統，可從考生的注視角度、頭部角度、手部動作等異常情況判斷作弊可能。而未有作弊跡象的考生，其臉部則會自動遮蔽以保護隱私。

AI 牙膏配方，獅王牙膏新口味開發時間縮短 20%
牙膏配方，並不是只有薄荷或水果口味這麼簡單而已。事實上，日本獅王（LION）在開發牙膏時，可是需要從500多種原料中挑選香氣與味道，接著摸索出最適當的比例，以打造出市場接受度高、適口性佳，又能帶點新意的牙膏口味。

而在牙膏開發任務中擔任重要角色的風味調配人員，稱作「調味師」。他們必須根據新產品的主要受眾（如不同的性別、年齡客群）或是特定的產品理念，耗費數個月以研發出一種新牙膏口味。

然而，獅王於今年8月正式公開他們的AI計劃，也就是讓AI針對獅王專業開發人員超過100小時的實作經驗、以及過去10年的一千多種配方數據進行機器學習，將人工智慧訓練成一名調味師。當AI模組逐漸成熟後，只要在系統輸入新產品特點，接著AI便會提供至少含有3種香料的牙膏配方，並且包含成分與比例的建議。

AI不只為牙膏開發人員減少反覆試錯、調整的時間，甚至也能預測產品製造流程中可能遇到的問題，例如牙膏質地與包裝的合用性。以往在研究開發階段，幾乎難以預測牙膏本體在包裝中的流動性；往往等到產品做出時，才發現牙膏難以使用，而不得不回過頭來重新考慮配方比例。

而在AI導入材料資訊學（MI，Material Informatics），便能提前預測此類狀況，讓新產品的製造工程能減少40%。這項AI牙膏開發系統，是獅王在2021年成立數位轉型部門「DX 推進部」之後的代表傑作，目的是為了提升新品開發效率，也或多或少引起市場好奇。而獅王也宣布，在未來1至2年內，消費者或許就有機會體驗AI製成的牙膏了。

AI 食譜，從料理影片自動生成烹飪步驟
日本電器大廠歐姆龍旗下專責研發的子公司 OMRON SINIC X，與京都大學聯合開發出一項 AI 技術，讓人工智慧可依據料理影片自動生成食譜。

這項AI技術的開發，首先從1,300支料理影片中分別擷取最重要的10個步驟，再將這些食譜步驟與 AI 編寫的食譜相結合，進而讓AI學習。透過機器學習的訓練，AI即可按照食材，辨識食材外觀在料理過程中的變化，並運用食譜中常用的詞彙，逐步編寫出食譜步驟。

例如在一次實際的演練中，AI 即根據一支炸豬排影片，迅速抓取幾個重要的步驟，接著自動生成「將豬肉裹上麵包粉」、「以平底鍋炸豬排」等文字。

AI 自動生成食譜的技術，未來將有機會廣泛運用於各種流程示範教學；只要讓 AI 熟悉該領域的常用步驟，即可透過影片迅速編寫出流程規範。例如：歐姆龍工廠內的生產製造流程，或是其他產業的 SOP（Standard Operation Procedure）訂定，更有效率的完成技術傳承、人員訓練等工作。

AI 演唱合成技術，「VOCALOID：AI」重現歌姬經典美聲
曾引領日本樂壇風潮，對日本音樂演藝界有著深刻影響力的傳奇歌姬——美空雲雀，在2019年逝世 30週年時，在日本YAMAHA公司與NHK的攜手合作下，運用最新AI科技與4K 3D 投影技術，將逝去的經典美聲與巨星風采，再度重現於觀眾面前，令人驚豔不已。

首先，為了盡可能真實再現美空雲雀的歌聲與演唱風格，YAMAHA開發出AI歌聲合成技術「VOCALOID：AI」，以美空雲雀生前的演唱、說話等錄音素材，作為AI訓練來源，並運用機器深度學習（Deep learning）分析歌手演唱任何語言歌曲的演唱特性，不只重現歌手的音色、音調，也能呈現歌手獨特的唱腔風格、甚至是旋律或歌詞間隙等細微變化。

此外，在本次 NHK 紀念歌姬逝世30週年的特別節目中，也導入4K 3D高畫質全息投影技術，讓真人等比例大小的影像出現在舞台上，彷彿傳奇歌姬再次降臨舞台，獻唱一曲。

值得一提的是，本次演唱的歌曲是日本製作人秋元康特別寫的新歌曲，也就是美空雲雀生前從未演唱過。這使得本次 AI 歌聲模擬、4K 3D影像重現的挑戰性更高。拜現代科技之賜，最終NHK於2019 年9月29日的特別節目中順利再現美空雲雀的表演，而「VOCALOID：AI」首次公開應用的成功，也令人期待更多傳奇經典的重生可能。

AI 廣告文案，未來的廣告內容將能即時自動生成？
廣告文案的生成，仰賴創作者對市場需求的洞察、對人類心理的理解，以及對文字的掌握度。AI人工智慧有可能製作出打動人心的廣告文案嗎？對此，日本電通廣告公司為提升文案生成效率，利用人工智慧開發了廣告文案生成系統——「AICO」（AI Copy Writer），或許有機會解答。

首先，日本電通為了AI廣告文案技術已經進行了大約五年的研究，並對「廣告文案的品質如何影響廣告效果」進行多方評量。接著進入技術開發階段後，日本電通與靜岡大學信息學部共同開發出「AICO」系統，除了運用大量的文案廣告作為AI學習素材，也讓實際的文案創作者投入研究開發，讓「AICO」的文案盡可能接近人類的創意。

事實上，電通開發AI廣告文案最主要的目的之一，是希望能讓廣告內容有機會依據「TPO」（也就是 Time時間、Place地點、Option時機）進行即時改變，讓廣告更靈活、更精準、更有效。在數位廣告、程序化廣告當道的今時今日，這項新技術很有機會為廣告傳播領域帶來新變革，令人拭目以待。

AI 語音導覽，讓視障者也能體驗逛街的樂趣
「櫥窗購物」（Window shopping）是一種很省錢的逛街方式，意思是不特別買什麼東西，就只是在商街隨意地邊走邊看，欣賞商家櫥窗裡的擺設，看著琳瑯滿目的最新商品，透過一飽眼福的方式享受逛街。

可惜的是，視障人士並無法直接體驗櫥窗購物的樂趣。在日本，約有超過 160 萬視力障礙者。為了讓視障者也可以享受逛街、享受購物的過程，日本電通團隊開發了一款名為「LISTENING WINDOW」的 App，讓視障人士，甚至是高齡長輩、幼年兒童，或是語言不通的外國人，都能透過這款工具自在的外出逛街。

「LISTENING WINDOW」主要利用iPhone的光學雷達（ LiDAR）功能，用以判斷手機到物體的距離，並識別物體的形狀。同時，也導入AI的圖像識別技術，讓手機鏡頭能為使用者扮演「眼睛」的角色。例如：視障者可在脖子上掛著手機走動，接著「LISTENING WINDOW」的AI系統會識別商店名稱，並提供語音導覽功能說明商店資訊。若使用者對商店有興趣，即可點擊手機螢幕，以獲取更多商家訊息、產品推薦、促銷資訊等內容。

一對視障夫妻在試用「LISTENING WINDOW」後表示肯定。例如：太太日向舞香從中學開始逐漸失去視力，僅剩非常微弱的弱視功能，而使用「LISTENING WINDOW」能讓她能在沒有旁人幫助的情況下獨自享受購物；先生日向賢則是先天性全盲者，能藉由這款工具知道平時常去的商店之外，原來還有很多其他店舖可以認識，他對此感到很有趣。

除了扮演視障人士的雙眼、提供語音導覽，「LISTENING WINDOW」還有更多應用的可能性。例如運用在大型商城、大型車站、旅遊區等公共場所，為高齡長輩、外國觀光客提供設施語音導覽，讓人人都可享有自由自如的行動。

LISTENING WINDOW
「LISTENING WINDOW」利用iPhone的光學雷達（LiDAR）功能，可判斷物體距離與形狀，且具備 AI 的圖像識別技術，讓手機鏡頭能為使用者扮演「眼睛」的角色，並提供語音導覽功能說明商店資訊。

AI 姿勢診斷，一分鐘提供姿勢矯正報告
現代人有許多姿勢不良的問題，由於久坐辦公室的工作型態，長時間使用電腦、或是低頭滑手機等習慣，導致肩頸、腰部、膝蓋等有僵硬或痠痛等症狀。長期姿勢不良，嚴重者還可能會帶來頭痛、睡眠品質變差等身心失衡等負面影響。除了對健康造成衝擊，姿勢不良也會帶來不好的印象，尤其在正式場合或商業情境中，不正確的姿勢，也會帶來較不好的形象觀感。

為了導正人們的姿勢，藉此改善體態與重拾活力，日本人工智慧開發企業Otafuku Lab與大阪大學數學與數據科學中心合作開發了一款名為「Posen」的AI工具，只要運用iPad拍照上傳使用者姿勢，Posen系統即可在短時間內對使用者的姿勢進行診斷和評分，並提供改善建議。從拍照到姿勢診斷結果出爐，僅需要一分鐘的時間。而診斷結果和建議可列印出來，或是下載電子檔保存。

Posen的應用除了幫助忙碌的醫師、物理治療師做初步的診斷，也可為企業作為員工教育訓練的工具。例如注重員工素養的飯店業者，即可運用Posen為員工做評量，並提供導正姿勢的建議，讓服務人員優化整體儀態，帶來專業有活力的形象。

同時，Posen也可為高齡長輩提供復健指南。讓AI讀取使用者的關節數據，如姿勢是否變形、或是活動範圍等數據，透過直觀的數值與分析圖像，讓長輩一目瞭然身體機能。此外，也可提供復健目標，讓長輩保有持續治療的動力，逐步恢復健康狀態。

此外，Posen也配備管理系統，可記錄使用者的姿勢報告與健康狀況，以此作為定期診斷、持續追蹤的工具。

輕鬆身體檢測
用 iPad 拍攝身體姿勢，15秒內AI即可進行骨骼分析、姿勢分析、關節活動度分析、運動功能檢測等。

AI 手語翻譯系統，打破聽覺障礙的溝通藩籬
根據日本厚生勞動省（衛生部）統計，日本約有35萬名聽覺障礙人士，其中約有14%的人使用手語；即使聽力並未完全喪失，也會使用手語作為溝通工具。然而，日本卻僅有4,000名手語翻譯員（約佔聽障者人數的1%），很難滿足所有手語翻譯的要求。

為了解除人與人之間的溝通障礙，讓聽人與聽障者可以交流，日本電信與媒體通訊業者 Softbank 開發了一款名為「SureTalk」的應用程式，透過AI實現手語和語音談話之間的相互交流。

SureTalk 有網頁版和 iOS App 兩種版本可免費使用。使用者只需註冊SureTalk，點擊「開始對話」按鈕，接著選擇自己喜歡的語言模式（手語或是語音），接著進入聊天室即可。在SureTalk的系統中，AI會透過視訊通話設備觀察用戶的身體動作，並擷取手語特徵、辨識手語，接著將其轉換為文本，讓聽力正常的人得以透過AI手語翻譯理解聽障人士的訊息；同時，聽人也可以直接說話，AI便可即時辨認音訊，轉換為文字訊息給對方。

在這整個AI手語辨識、語音辨識、轉換文本的過程裡，主要運用了三種技術。其一，是「手語辨識技術」，利用深度學習追蹤使用者的動態動作，讓用戶不必侷限於顏色單調的衣服、綠幕背景，或必須使用深度傳感器等特殊條件，即可在一般日常環境中，辨識影像中的手語內容。

其二，是「自然語言處理技術」，讓AI進行手語單詞與日語單詞的對應，包含日語文法中的動詞、助詞、助動詞等，透過翻譯模型訓練，讓AI在手語辨識後，可以將單元手語表達的詞序，轉換為正確的日語詞序，呈現出更自然、精確的日文語句。

其三，則是「語音處理技術」，就是類似聽打的語音辨識功能。當聽力正常者發出的語音訊息時，即可透過AI即時轉換為逐字文本。Suretalk收集了各種環境下的語音數據，例如嘈雜環境、有背景音樂的環境等，以此來訓練AI聲學模型，提高現實生活環境中的語音識別準確率度。

隨著愈來愈多人使用 SureTalk，AI便可透過機器學習提升手語識別的準確性，打破聽覺障礙的藩籬，實現人與人之間更順暢的交流。

訊息轉換器
日本電信與媒體通訊業者Softbank開發了一款名為「SureTalk」的應用程式，使用者只需註冊 SureTalk，點擊「開始對話」按鈕，選擇手語或是語音，便可利用AI將手語或語音轉換為文字訊息、達成溝通。

原來AI這麼近！ 充滿日常實用性的AI應用