Google計畫應用圖像識別技術,配合人工智慧識別等技術,讓電腦系統能自動識別照片影像內容,並且透過認知系統為照片加上相關文字描述,進一步應用將可配合文字轉語音等技術,協助視障者了解影像內容,或應用在人工智慧與機械學習。而相關技術應用,史丹佛大學也已經投入研發內容。 根據Google公布消息,表示目前正著手研究可結合圖像識別、人工智慧辨識等技術,讓電腦系統能自動識別照片影像內容,透過認知系統"了解"照片內容後,即可自動加上文字描述。 目前此項技術仍處於前期測試階段,暫時還無法完全正確做出精準描述內容,史丹佛大學方面也已經投入相關研發內容,預期未來將能進一步協助視障者使用電腦操作服務等應用,甚至也能進一步應用在人工智慧記憶或機械學習等範圍,或是協助更精準的圖像搜尋比對。 相關技術主要建立在影像內容分析,並且讓系統清楚識別影像中主要物件、相對位置、互動關連,以及可能代表含意等,同時目前分析影像來源包含Pascal、Flickr8k、Flickr30k與SBU等開放影像資料庫內容,讓系統能藉由大量影像數據學習如何正確識別物件,並且配合在地語言轉換成最佳文字描述內容。
|