輔具新知詳文

Google讓電腦更「了解」照片內容

聯合新聞網/記者楊又肇

撰文時間：2014/1/19
Google計畫應用圖像識別技術，配合人工智慧識別等技術，讓電腦系統能自動識別照片影像內容，並且透過認知系統為照片加上相關文字描述，進一步應用將可配合文字轉語音等技術，協助視障者了解影像內容，或應用在人工智慧與機械學習。而相關技術應用，史丹佛大學也已經投入研發內容。　　　　　　　　根據Google公布消息，表示目前正著手研究可結合圖像識別、人工智慧辨識等技術，讓電腦系統能自動識別照片影像內容，透過認知系統"了解"照片內容後，即可自動加上文字描述。　　　　　　　　目前此項技術仍處於前期測試階段，暫時還無法完全正確做出精準描述內容，史丹佛大學方面也已經投入相關研發內容，預期未來將能進一步協助視障者使用電腦操作服務等應用，甚至也能進一步應用在人工智慧記憶或機械學習等範圍，或是協助更精準的圖像搜尋比對。　　　　　　　　相關技術主要建立在影像內容分析，並且讓系統清楚識別影像中主要物件、相對位置、互動關連，以及可能代表含意等，同時目前分析影像來源包含Pascal、Flickr8k、Flickr30k與SBU等開放影像資料庫內容，讓系統能藉由大量影像數據學習如何正確識別物件，並且配合在地語言轉換成最佳文字描述內容。
摘錄：Google計畫應用圖像識別技術，配合人工智慧識別等技術，讓電腦系統能自動識別照片影像內容，並且透過認知系統為照片加上相關文字描述，進一步應用將可配合文字轉語音等技術，協助視障者了解影像內容，或應用在人工智慧與機械學習。
參考網址：http://mag.udn.com/mag/digital/storypage.jsp?f_MAIN_ID=320&f_SUB_ID=2943&f_ART_ID=546505
Top