日前,谷歌研究院在圖像識别領域取得新進展,根據其科學家發表的文章顯示,未來谷歌的圖像識别引擎不僅僅能够識别出圖片中有什麼,還能用一句話對整個圖片内容進行準確描述。
據悉,該技術基於機器語言翻譯,通過一種遞歸神經網路(RNN)將一種語言的 語句 轉換成向量表達,並採用第二種RNN將向量表達轉換成目標語言的語句。
谷歌所做的是,將以上過程中的第一種RNN用深度卷積神經網路(CNN)取代,而CNN可以用來識别圖像中的物體。
科學家表示目前研究僅處於早期階段,但描述簡單的場景已經比較合理了。
描述轉換過程
以上文章來自http://news.mydrivers.com/1/335/335670.htm
科技真的是越來越進步了,未來居然可以利用圖片就可以寫出來。真是太厲害了。
本文章最後由( 陳誠誼 )於 2014-11-20 06:11 編輯
本文章最後由( 陳誠誼 )於 2014-11-20 06:13 編輯
我是東尼 發表於 2014-11-20 09:51
真是太神奇了... 以後名人走在路上搞不好都會被監視器認出來, 直接拍照上傳網路(想太多?)
...