MiniGPT-4完勝ChatGPT-4,搶先開放AI圖像識別功能,實測商務與生活必用10大招術

MiniGPT-4的識別圖像功能在商務及生活中的應用非常多,上傳圖片,它就可以分析圖片,生成優化建議、寫程式、生成食譜、識別知名景點與電影等等,本篇實測了10個MiniGPT-4的應用。

OpenAI在發布時ChatGPT-4時,就宣布ChatGPT-4具有圖像識別功能,為此,我還特意付費訂閱GPT 4.0,左等右等1個月過去了,OpenAI都沒開放,現在MiniGPT-4搶先開放識圖功能,還是免費的!

什麼是MiniGPT-4?

MiniGPT-4是由沙烏地阿拉伯阿布都拉國王科技大學的博士生團隊開發,它可以識別圖像。MiniGPT-4是由Vicuna大型語言模型(LLM)、帶有預訓練 ViT 、 Q-Former 的視覺編碼器和線性投影層組成。模型架構如下圖所示:

如何使用MiniGPT-4?

【MiniGPT-4官網連結】https://minigpt-4.github.io/

點選紅框處上傳圖片。

點選Upload&Start Chat上傳圖片按鈕。

在User對話框輸入要MiniGPT-4回答的問題,最好用英文輸入,它目前只能理解部分中文。

圖像識別商務應用實測1:分析產品圖片

商家可以上傳自家商品圖片,請MiniGPT-4分析自家產品,看看在AI眼中我們的產品是怎樣的狀態。我請它分析上面我上傳的圖片,雖然我是用中文輸入,它卻使用英文回覆。

圖像識別商務應用實測2:看產品圖片編故事

由於MiniGPT-4可以看見產品圖片,所以它編出來的故事就顯得很貼切產品。

我一樣用中文輸入,這次它就有用中文回覆,它的回覆有時會中斷,要請它繼續,它才會說完。

圖像識別商務應用實測3:看產品圖生成文案

你是否常常為了產品的文案想破頭,用chatgpt生成的文案,又因為chatgpt無法看到產品,所以感覺它總是少了點什麼,這時MiniGPT-4可以識圖的功能就顯得非常實用。

雖然MiniGPT-4又跳回英文回答,我也有嘗試請它翻譯成中文,但它有時無法理解,所以我就轉用翻譯軟體翻譯。

圖像識別商務應用實測4:看圖作詩

當我們的想要販賣的產品有了故事、文案,我又想到可以再請MiniGPT-4幫我為我的產品做首詩,增加客戶對產品的情感價值。

圖像識別商務應用實測5:優化logo

既然MiniGPT-4可以分析圖片,我當然要請它幫我分析一下AI IDEAS的LOGO,看我們的LOGO哪些地方可以再優化。

圖像識別生活應用實測6:看菜餚照片生成食譜

MiniGPT-4的圖像識別功能不只可以應用在商務上,也可以應用在生活中,當我們看到美味的菜餚圖片,卻不知道要如何做時,可以問MiniGPT-4,但它這功能還不是很成熟,最好還是用英文發問得到的回覆會比較精準。

圖像識別生活應用實測7:識別國外名人

相信有不少華人很我一樣,覺得外國人都長得很像,總覺得看著眼熟,又認不出是哪位名人,在這方面MiniGPT-4可以幫我們解決這個困擾,在識別國外名人的準確度上蠻高的,目前對華人的名人就識別不出。

圖像識別生活應用實測8:看圖識別電影

看到電影畫面卻想不起來這是哪部影片嗎?MiniGPT-4也可以告訴你唷!只是它目前也是只能識別國外知名影片與日本知名卡通,對華人的影片、電視劇就顯得準確度很低。

圖像識別生活應用實測9:看景點圖識別出地點

看到美美的景點照,想去可是又不知道它在哪裡嗎?上傳照片到MiniGPT-4,讓它告訴你唷!它還可以安排旅遊行程。

圖像識別生活應用實測10:看梗圖分析出笑點

不得不說MiniGPT-4開放識圖功能,真的是比ChatGPT好用多了,連梗圖的笑點它都懂。

MiniGPT-4實測心得

在實測MiniGPT-4後,雖然它對中文的理解還欠缺訓練,數據庫也缺乏華人的資料,但在英語的使用上,我衷心佩服他強大的圖像識別能力,相信MiniGPT-4遲早也會擴增華人的資料庫,讓我們使用起來更便利。

MiniGPT-4實測影片