如果由谷歌来决定,我们将来在会议上都会以 3D 人物的形式出现在屏幕上。据 Androidnews报道,该公司正与惠普合作开发一款能够将 2D 图像转换为 3D 的显示屏。这项技术名为Google Beam,通过人工智能将来自六个不同摄像头的图像融合为一个整体。这些图像看起来就像真的有人坐在你对面,而实际上只是一个屏幕。该技术能够实时跟踪头部,确保画面始终清晰自然。
视频通话中的实时翻译
在 Google I/O 大会上展示的另一项功能是视频通话中的实时翻译。作为示例,科技公司展示了一段英语和西班牙语的对话。该技术会将所说内容翻译并以另一种语言说出。这样,说英语的人听到的是英语,而说西班牙语的人听到的是西班牙语。AI语音能够模仿语调、语音模式和语调。据谷歌称,所有这些操作均在实时进行。
谷歌推出实时AI翻译工具。该神经网络可实时同步说话者的声音、语调和情感。
— NEXTA (@nexta_tv)2025年5月21日
该公司表示,借助这一工具,人们可以随时随地进行沟通——仿佛语言障碍从未存在过。pic.twitter.com/eXeE6zql48
该功能现已在Google Meet中推出,但仅支持英语和西班牙语。未来将支持更多语言。
来源:Androidnews