(2015-01-29)【數位媒體風向球】名為「鵝毛筆Quill」的軟體,正獲得富士比、萬事達卡等公司的重用。究竟自動撰寫文章軟體,解決了哪些問題?
(Brain.com2015-01-29)【數位媒體風向球】鵝毛筆(Quill)是西方古代書寫的工具,用鵝或大型禽類翅膀的羽毛,削成筆尖沾墨水在紙上書寫。羽毛桿能附著墨水,沾一次墨水能寫不少字。
應書寫的需要,筆尖可切割不同的粗細,加上手指的壓縮控制墨水的多少,可以寫出美觀的字體,稱為「鵝毛筆字體」(Quill Font)。
現在當然不必再用筆寫,多種鵝毛體的字型電腦裡都有,常見於各式請帖與招牌。
鵝毛筆Quill與「鵝毛筆字體」Quill Font 。(圖片取自網路)
用鵝毛筆可以寫作文,鵝毛筆自己卻不會寫作文,芝加哥一家叫Narrative Science的公司,製作了一個會寫文章的軟體,戲劇化的稱作鵝毛筆Quill。
寫文章總得有資料來源,Quill的資料來源主要是數字資料,也就是俗稱數據的非文字資料,寫出來的則是經分析、解譯後的文字敘述。下圖就是Quill把一些數據翻譯成文字的節錄,建議讀者點選放大,檢視Quill的作文是否通順。
半年以前,我曾提過「機器人編輯」(2014.7.28),介紹電腦軟體編輯新聞,從零散的資料整理出頭緒,然後用自然的語言寫出大家都懂的文字敘述,再迅速發佈──像是洛杉磯地震的報導。我在這篇文章最後說,有些人也許會一如往常,說這些機器編輯不過編寫例行的制式文稿而已,絕不會超過人類編輯的智慧。
Quill 的出現,讓這個說法開始搖動。
富比士(Forbes)是Quill的用戶之一,在網站上有一個Narrative Science專頁,全部的文章都是從投資研究機構取得的數據,再用Quill翻譯的文字敘述,以及從中分析的內涵,建議讀者瀏覽。
除了富比士,還有萬事達信用卡、德勤會計事務、瑞士信貸等多家國際財務機構,以及美國情報機構,使用Quill寫文章。
這些財務機構使用Quill的主要用途,在於撰寫基金的表現報告,然後分送投資人參考。
Narrative Science執行長 Stuart Frankel 說,通常需要一組人力幾週完成的報告,Quill只需要幾秒鐘完成,有的報告長達20頁。至於美國情報機構,與別的客戶在做法上沒有什麼區別。Quill無疑是高產量作家,僅十餘家客戶,每天寫的總字數高達數百萬。
Quill是專利的軟體,技術細節並沒有對外透露,僅在網站上簡介運作的程序。
首先是分析數據料,依據客戶的特質找出相關的事務,同時也檢驗取得的數據是否合乎邏輯,有沒有錯誤。
第二步是結合相關事務與數據,再依自然語言處理(Nature Language Processing 簡稱 NLP)的規則製造內容。
第三步是強化所產生的文件,給不同的人寫不同的文章,像是給證管會就需要長篇詳細報告,而給市場促銷的文宣則強調正面的資訊。
人工智慧是資訊科技的重要一環,許多機器都能做人的工作、甚至比人做的更好,莫不以人工智慧做基礎,Quill的寫作能力,除了把數據轉換成文字,還能附加語氣。如果你喜歡的球隊輸了,Quill會用婉轉的語詞告訴你球隊的失利,不會「客觀」的告訴你輸了。
當然你先要告訴Quill你喜歡的球隊,但Quill會根據比賽的結果選用適當的用詞。專家們認為這樣的功能,已經超越撰寫例行報告而進入「作文」的能力了。
大數據,無疑是今天的熱門話題,從龐大沒有結構的資料,藉人工智慧的電腦軟體,挖掘出有用的資訊,但挖掘的結果,又往往是龐大的數據性資料,以及複雜的圖表,需要專業的閱讀解譯,才能瞭解內涵,這也是大數據發展的速度不如預期的原因之一。
Quill與類似軟體,運用自然語言處理的技術,填補了大數據運作的最後階段,以文字的敘述,讓大數據快速的發揮效用。
工廠裡的機器人可以替代工人,自動編輯的軟體是否可以替代人類的編輯?甚至是否可以替代新聞媒體的編輯人力?Quill並不是唯一的自動編輯軟體,「機器人編輯」裡的Automated Insights,以及歐美數家新興公司,都朝這個題目發展,使得學術界認真的思考這個問題。
本專欄會在下一次(ePublishing 20150209)深入探討這個新聞製作對電腦的最後防線。只是,據初步實驗的結果,讀者分辨不出電腦寫的還是人寫的。
※本文取材自2015年1月26日「那福忠ePublishing電子出版簡訊:鵝毛筆會作文」。對本文有任何看法,歡迎eMail:frank.na@gmail.com給作者,分享您對本文的看法。
(Photo Via Charles Stanford CC License)