Google I/O推出生活數位助理 AI如何改變生活?

緊接OpenAI的新GPT-4o發布消息後,Google也在美國當地時間14日上午10時,於加州舉行年度開發者大會Google I/O,其中AI的發展不僅令人矚目,也是本次大會的重點。
本次大會中Google除了推出能生成圖像的Imagen 3、生成影片的Veo兩款模型,以因應OpenAI的Dall-E 3與Sora,也提出更多將旗下AI Gemini應用於生活中的項目。
Google表示,開發真正實用、可以在日常生活中協助人類的通用 AI 代理,一直是他們的使命之一,這些功能都將於不久後上線,但初步多只支持美國境內的英文搜尋。
AI助理項目「Project Astra」能做到什麼?
Google在大會中發表了開發AI助理的「Project Astra」項目,有別於聊天式的AI如ChatGPT等,Project Astra能透過手機鏡頭或智慧眼鏡與Google旗下的AI Gemini即時互動。
該項目目標結合語音互動、影像識別、環境感知等方式,讓人工智慧即時描述、解釋鏡頭拍攝到的畫面內容,同時也能記憶過去的內容。
在展示影片中,Google的工作人員在辦公室內拍攝,並要求Gemini在看到「能發出聲音的東西」時告訴他,Gemini隨即回應,「我看到1台喇叭。」
工作人員又走到落地窗前拍攝風景問道,「你覺得我在哪個地方?」
Gemini說道,「應該是在倫敦的王十字車站。」並介紹了該景點的特色。
隨後工作人員說道忘記自己的眼鏡放在哪了,問Gemini是否記得?Gemini準確指出眼鏡被放在桌上的一顆蘋果旁。
Google表示,雖然他們已在開發能理解影像、音訊、文字等多模態資訊的AI系統方面,取得了大幅進展,但要讓AI的回應速度快到像人類對話一樣自然仍是一大挑戰,在經過幾年的調整才終於達到如今的成果。
預計該功能將於今年稍晚在Google產品如Gemini App上推出。
不知道怎麼提問? 直接拍影片「問」AI
Google也結合AI與搜尋本業,讓使用者無須用文字描述、直接透過影片影片搜尋問題。
Google在官方部落格中以「二手黑膠唱片機跳針」的情境來演示,透過Ask with Video的功能,使用者只需要拍下黑膠唱片機故障的影片,AI就會自動辨識搜尋。
Google相簿越來越大? AI快速找出所需照片
另一個和AI結合的Google產品是相簿,Google表示每天有超過60億張照片被傳到Google相簿中,使用者若要尋找特定內容的照片往往需要自行過濾許久。
透過「Ask Photos」的功能,未來使用者只需要向Gemini表示「找出有我的車牌號碼的照片」、「找出我去過的國家公園照片」,Gemini就可以在短時間內從相簿中找出符合指令的照片。
搜尋結果太多沒時間看? AI製作總覽快速找解答
過往搜尋時會出現大量的結果,往往需要時間慢慢過濾才能取得所需資訊,Google將AI功能與搜尋結合,讓搜尋結果呈現的同時也會提供使用者概要資訊,快速瀏覽。
Google表示目前該實驗功能使用次數已達數十億,且多數使用者搜尋結果的滿意度也有上升,該功能將先在美國推出,預計在年底前會開放其他國家使用。
可自訂Gems 打造個人專屬AI助理
Google也推出了可依個人需求,製造出不同個性與專業的AI助理功能「Gems」。
透過該功能,使用者能將AI助理設定成健身夥伴、營養師、軟體工程師,要求Gems幫忙制定健身計畫、備餐菜單等等。
Google表示未來預計將更多旗下產品,如日曆Google日曆、任務管理程式Google Tasks和筆記產品Google Keep與AI整合,「未來你可以拍下孩子的學校課表,然後要求Gemini建立對應的行事曆事項,或是拍下一個食譜並且將待採買的食材加入Keep做成購物清單。」