记者实测Gemini Live粤语对话!镜头分享功能强但咬字“广味”太重?语音转录/翻译/抓要点真实体验

文: 李加傑
2026.04.27

AI︱Gemini Live︱使用AI工具查资料确实挺方便的,不过有时候在手机上面见到一些内容想查,很有可能要截张图或者打段字问AI,如果有大量资料的话,动不动转来转去确实就不那么方便了!Gemini AI就有不同的玩法,皆因它有一项叫“Gemini Live”的功能,可以通过语音形式直接互动,在此之中更有镜头及屏幕分享,让Gemini查看画面,只要再用语音就能轻松得到想要的答案,不过在Gemini Live使用粤语交流效果是否良好?得出的答案是否有用?是否真的方便?这次编辑就实测一下,看看能不能提升我们的使用体验!

AI|Gemini Live利用语音即可交流

Gemini AI的用途很多,能简化不少诸如找资料、制图,以及翻译等工序,但很多人在用它时,还是只会透过打字及汇入图片影片的方法来作为指令,这样都会浪费不少时间。事实上,Gemini在手机App上还有一个叫“Gemini Live”的功能,使用它就能直接利用语音与其交流并得出想知的资讯,这样哪怕是有很多资料要处理,或是双手都没有空时,仍能利用Gemini得到答案。

AI|Gemini Live使用限制

不过Gemini Live仍有一些使用限制,最主要的一点就是只能在手机及平板App上使用,电脑及手机上的网页版本仍未支援该功能,所以用惯电脑、不下载手机App的用户们,暂时只能望梅止渴了。另外,这功能对于讲广东话的朋友来说也不算友善,因为其广东话语音并不标准,充斥着满满的“葵芳”味之余,在把语音转录至文本时亦有很多错字。

AI|Gemini Live镜头及屏幕分享实测

整体上Gemini Live能理解我的指令并作出回应,而作为Gemini Live的两大卖点,镜头及屏幕的分享效果又会如何呢?

镜头及屏幕分享实测|翻译英文至中文

我就先简单地找了一篇英文读物《The Necklace》,然后透过语音直接叫它翻译成中文,看看有没有效(详情请看下图)

而结果显示,使用镜头及屏幕分享后,给出的指令确实能被执行,问题在于转录多错字,且第一段的翻译明显有问题,用普通的Gemini AI去翻译时,整个效果都明显不同,而且显示上亦不便令人看得头晕。更甚者我用镜头转录时还要担心自己的手会不会太震,所以想翻译还是别用Gemini Live这功能会好一些。

镜头及屏幕分享实测|资料整合

虽然只用镜头及屏幕,比较难一次将所有内容直接给予Gemini Live处理,但我们应该能从所看到的资料中进行一些简单的整合。这里我就找了U Lifestyle的隐私政策来总结一下内容(详情请看下图)

就结果而言,它能分析出我给予的内容是什么,而且给出相应的资料简单概括,然而可能是画面内资料太少的问题,所以这个简单的概括确实“简单”了一点。至于把语音转录成文本的效果如何,就看各位是否能接受了(详情请看下图)

AI|Gemini Live英文及广东话交流效果差别

最后,编辑纯粹用英文及广东话语音交流,问之前要求翻译的文章《The Necklace》的简单概要,除了发现编辑的英语及口语能力很差外,还能知得Gemini Live在英文的理解上会好一点,而广东话结合英文的情况下虽然会显得尴尬,但也能顺利给出答案。然而用镜头及屏幕分享功能时,它所给出的答案却会显得比较混乱,所以就现时来说,使用英文交流的体验或者会好很多,而想要翻译、概括整段内容的资料,使用Gemini Live的镜头及屏幕分享方式就不太合适了。

资料来源:Gemini AI、Google


请您睇🎞️《王命之徒》由韩国真实历史改编!

↓🏆荣登历代韩国电影票房第一位↓

↓🏆荣登历代韩国电影票房第一位↓