極密曝光！GCP架構實戰！

極密曝光! GCP架構實戰! - AI學習應用

提起大眾對於Google的印象，不外乎是最先進的研發能量與創新精神，可以說是各種開源新技術的先驅，從K8S，再到TensorFlow的開源，幾乎都有Google的蹤影。尤其又以AI (Artificial Intellience)技術所為人稱道，現在市場上所使用的Google產品，大部分也是透過GCP的AI技術來搭建的。可是GCP提供的AI技術與產品究竟有那些呢？

本文將會先探索AI究竟是怎樣的技術，並且討論關於GCP AI服務的類別以及差異之處，最後是GCP的「Vision API」實作。

AI是什麼？

AI（Artificial Intelligence），人工智慧。被發展為一項透過機器自主學習，使電腦能夠模擬人類的思維過程，或者展現特定行為，比如說：判別問題、提供預測、語音與圖片辨識、翻譯等。我們現在常見的聊天機器人、Google翻譯、圖片自動偵測、以及疫情之下最夯的人臉辨識，都是AI的應用；而最為人所知的則是Google AlphaGo 打敗世界棋王的案例。
那麼AI真的可以像電影演的那樣？成為有感情的機器「人」嗎？

美國哲學家John Searle將AI分為「強AI (Strong AI)」與「弱AI (Weak AI)」。前者具備自我意識、情感等人類的特質；而後者則是展現出人類某種特有的行為能力，例如辨識圖片、辨識語音等等。而目前所有發展的AI都是所謂的弱AI，真正具備心智的強AI，大家可以參考電影「脫稿玩家 (Free Guy)」中對人類產生情感的蓋伊。

AI學習的過程？

AI人工智慧的核心基礎是「機器學習」，也就是常聽到的Machine Learning（ML）。而機器學習，就是讓機器學會判斷特徵（Feature）的一個過程（Training），在這個過程需要透過演算法產生的訓練模型（Training Model）來進行學習，同時又分成兩種學習方式：監督式學習（Supervised Learning）、非監督式學習（Unsupervised Learning）。
若我們今天要讓機器學會判斷狗和貓的圖片，以監督式學習的角度而言，我們必須先透過人為篩選出貓和狗的圖片，並且各自加上標籤（Label），並加以訓練；而非監督式學習，則是將大量資料匯入，並且讓機器自己判讀跟學習不同圖片的差異。甚至有時候我們希望AI能夠幫我們判別貓狗，結果AI在非監督式學習的過程中，還自己學會判別毛色，這就是所謂的非監督式學習。

AI的三大範疇

AI的三大範疇可以參考下圖，AI人工智慧包含了Machine Learning機器學習，而機器學習又包含了深度學習。AI是透過程式碼來運作軟體，來讓這個軟體能夠感知、辨識等的類人類行為。而支撐著AI的是ML機器學習，主要包含了演算法、數據等。最後則是深度學習（Deep Learning），算是機器學習的其中一個分支，通過模擬大腦神經網路，建立不同分層，可分為輸入層、隱藏層、輸出層，也稱為神經網絡。而在隱藏層的部分會比起傳統機器學習的模型還需要更多的資料；並且深度學習會將這些大數據的特徵自行提取、分類，最後取得最靠近正確答案的解答。例如前述提到的AlphaGo，即為基於Deep Learning所建構的人工智慧，通過大量棋譜的輸入、自我訓練，最終擊敗世界棋王。

極密曝光！GCP架構實戰！ - AI學習應用

GCP AI 服務

Vertax AI：

屬於整合式的AI平台，這項產品適合接觸過AI，且能夠理解AI技術所帶來效益的人使用。在這個產品中，使用者可以快速建構自己的訓練模型，就算不具備撰寫演算法的技術資源，也能夠輕鬆搭建自己的AI Training Model。需要注意的是，Vertax AI的前身是GCP的AI Platform，目前仍支援AI Platform的介面，但大部分功能皆已整合進Vertax AI，可以直接使用Vertax AI進行相關作業即可！

適合對象：資料科學家、想使用AI的工程師、資料分析師

Natural Language API：

Natural Language為自然語言分析的AI應用，可以擷取非結構化、半結構化的文字資料來進行探索，並取得深入的文字分析結果。可以分析出情緒、文法結構、單字組合等等。適合需要進行大量文字探勘的工作。

適合對象：進行大量文獻探勘者、醫療照護者（心理治療相關應用）、資料科學家

Speech-to-Text API：

Speech-to-Text是大家相當熟悉的一款服務，主要是做語音轉文字的AI辨識。例如Google Map中，透過語音轉文字的服務，讓司機只需要念出地址，而不用手動Key入文字。或者是現在短影音創作的市場興起，透過語音轉文字的方式快速產生字幕，堪稱是創作者的福音！

適合對象：開發導航、語音相關服務產業

Translation API：

Translation顧名思義就是透過AI來進行文字翻譯，不曉得各位有沒有注意到，在2006年Google翻譯剛推出的時候，那時候的翻譯並沒有那麼正確，也不容易讀懂翻譯後的文字。但是到了現在，由於大量資料的累積，Google翻譯有越來越精準的趨勢。而Google也將其大量訓練後的模型發布為Translation API，提供使用者能夠快速進行AI翻譯的任務。

適合對象：語言翻譯應用、跨國平台開發、結合Speech-to-Text的語音等等。