首頁
1
最新消息
2
健康新知
3
AI與產業廣泛應用的距離 4

a21ae21e68749a9676e855c0e01a841d.png
文/夏肇毅 CubicPower晶智能中心創辦人

 

AI人工智慧議題近年來發燙,各類應用的新聞如雨後春筍般冒出。AI可以用來解決各式各樣的問題。就像現在COVID-19新冠病毒疫情嚴重,世界各國很多人嘗試著用人工智慧來找出跟疫情相關的因子,試圖預測未來各地染病的人數,替世界盡一份心力。

 

開發解決一個問題的人工智慧模型需要「餵入」大量資料,再經過幾天幾夜的訓練後才能使用。但能不能訓練出結果來,還在未定之天。萬一不行,就要試著調整模型,再加工一下資料,等待幾天後再看一次結果。但時間就是金錢,電腦資源用得越久就花得越多。而事前標示資料正確答案,更需要大量人力來處理,國外新創人工智慧公司曾表示,八成以上的人力都在做資料答案標示。聘用的大量高薪人員也造成十分沉重的負擔。

 

在前幾年AI風潮剛起,有大量資金投入時尚能支應。那時大家爭先恐後卡位,不怕燒錢只怕搶不到人。幾年過去,卻猛然發現成果有限,無法兌現對客戶的承諾。在長成金雞母無望,不堪長年虧損之下,只好砍人收攤。

 

人工智慧的開發流程

一個人工智慧應用研發的步驟包括設計模型,整理資料與訓練模型。一般人工智慧的程式都不大,所以業者會主動分享各式研究好的模型讓人免費使用,再以推廣服務的方式來搶佔地盤,圖的是日後租用運算設備的生意。

 

模型是人工智慧運作的核心,粗淺的模型需要輸入和記憶中的範本很相似才能識別。深層模型能將特徵濃縮汲取,只要本質一致就可以識別。有模型後就要加以訓練,如訓練好的語言模型能將字詞濃縮成相近的語意代號,這樣能大幅縮減識別範本記憶的規模。訓練也需要大量資料才能見效,像語音識別,先要訓練出聲學模型。這需要將高低快慢各種口音的樣本都先熟悉一次,才訓練得起來,否則最後的識別率會很差。等到聲學模型識別輸出後要再連到語言模型處理,這樣人工智慧才能識別出說話的語意。

 

由此可知,人工智慧的運作需要大量的資料範本做基礎。它的基本原理,是要從分析大量資料的過程中,尋找特徵並記憶答案。之後再次碰到這些特徵時,就可以很快的分析出之前記住的答案。就像考試一樣,記得的考古題越多,答對命中率就越高。因此,擁有大量資料是發展人工智慧的基礎。然而只有平日接觸大量客戶,有客服的大公司才能擁有這些應對過程,以及大量人力來處理收集到的資料。

 

人工智慧的教學方式

近幾年,政府與學術界不斷以開學堂的方式推廣AI知識。有國家研究單位人士為了推廣人工智慧到產業界,特別募款設立了學校,廣收企業人士就讀,以傳播人工智慧知識。這些推廣的方法基本上是學校形態的延伸,離大量產業化應用有相當的距離。根本的原因,是因為資料調整與模型研發耗時費力,只適合有大量人力與時間資源的學術界進行。一般中小型公司,資源與財力有限 ,實在沒有辦法從頭開始投入做這些事情。

 

原理與程式教學,只需針對有軟體研發能力的ICT公司進行即可,目的是讓他們能夠運用現有模型開發人工智慧的新應用到他們的產品裡。老實說,有軟體研發能力的ICT公司研發人員,從網路上就能學到足夠的知識與資源快速上手,沒必要大費周章再去上課。

 

人工智慧於產業應用的條件

但對於大多數的產業來說,他們沒能力開發軟體,只想知道如何操作。加上一般人工智慧模型都只能處理固定大小尺寸的資料,所以餵入之前都需要事先處理好,否則便會產生錯誤。這些調整的事項,通常都是由程式設計師在訓練AI模型時一併處理的。一旦程式不夠聰明,一般人使用時就會遇到挫折而放棄。所以必須要將AI的應用程式調整成防呆好用的模式,讓一般人用起來就如用Excel一樣方便,才能快速導入到各行各業。

 

由此可知想要將人工智慧推廣到一般公司裡面,要先能自動處理掉資料大小格式不一致等一些囉哩囉嗦的問題。讓使用者只要將資料輸入,其他都不用做就能順利地訓練與預測才行。做到這種境地時才有機會開始推廣,讓人工智慧遍地開花。想要這樣,就必須先結合學術界的資源,先將一些成熟可行的模型包裝起來,加強對輸入資料的預處理能力,簡化操作流程,之後再濃縮成一個精實的產品。

 

菁英階層與企業間鴻溝頗深且廣,以學術觀點出發的傳教方式畢竟走不遠,中間需要先結合眾多軟硬體開發公司一起努力,讓企業對企業才行。要想像只有能將AI產品做到如一支新手機一般好用時,普及AI人工智慧應用的努力才能見效。

轉載自:https://view.ctee.com.tw/processing/19875.html


上一個 回列表 下一個