扎克伯格:AI技术才是AR和VR的万物之源

在去年一连串的轰炸之下,“元宇宙”这个词终于被“用滥了”。当Meta提出全面转型元宇宙时,就已经骗过了不少人。而当那些追随者纷纷晒出自己所谓的“元宇宙”产品时,Meta再一次拿技术实力打了它们的脸。充分结合了AI技术,将是未来AR…

在去年一连串的轰炸之下,“元宇宙”这个词终于被“用滥了”。

当Meta提出全面转型元宇宙时,就已经骗过了不少人。而当那些追随者纷纷晒出自己所谓的“元宇宙”产品时,Meta再一次拿技术实力打了它们的脸。

充分结合了AI技术,将是未来AR/VR发展的重要一环,这一点我们在Quest 2、以及Workrooms等产品上已经看到。包括Quest 2的定位追踪,手势识别,桌面和沙发追踪,键盘追踪等都不离不开AI技术的加入。

这一次,Meta打算进一步发挥AI的作用,让AI技术生成你想要的虚拟场景,“你说出来,机器就做出来”,给了一众BUG多、审美怪的”元宇宙“怪咖当头一棒。

不仅如此,这项研究基础“基于AI的语言和机器翻译模型”也将被用于更多场景。在今天的AI技术论坛(Inside the Lab)上,Meta向外界展示包括:Builder Bot、基于LASER语言工具包的多语言翻译模型、语音助理AI模型Project CAIRaoke、成立人工智能学习联盟,免费在线提供课程。

同时,Meta熟悉AI科学家杨立昆也分享了打造具备生物级别思考能力的AI模型愿景,通过自主智能架构,让AI模拟世界的运作方式,接近人类智能水平,简直不可思议。

当然,我们在本文中将重点来说一下Builder Bot和多语言翻译模型。

1,理想化的三维场景创建模型

众所周知,目前的VR设计平台一个重点就是虚拟场景的丰富性,其中包括头部VR社交平台已经允许用户自定义虚拟场景,这是保持多样性的重要一步。

对于大多数而言,在三维场景中(例如佩戴VR条件下)创作并非易事,不仅效率低下,而且难以达到理想的状态。当然,我们知道很多的虚拟场景基本上也都是在2D屏幕下,通过专业设计师或准专业人士(爱好者等等)来开发的。

所以,对于Meta这样的企业也一直在思考,VR和AR中的便捷性如何体现。

AI或许是最好的方案。就像是如今AI创作画作一样,将AI技术延伸到三维场景中,你指出要说出你想要的场景,Builder Bot就能帮你实现。

从上面的视频也能看出,扎克伯格的整个演示视频基本十分流畅,机器能够听懂创作者意图并且给出基本合理的场景,很难挑出其中的瑕疵。

扎克伯格表示:AI是元宇宙的关键技术之一。正如AI、机器学习等技术在其它领域的应用,在虚拟场景中它可以用来帮助我们很好地理解上下文,甚至像人类一样理解和预测我们想要做什么。这一趋势,未来会更为明显。

2,人工智能学习联盟

在介绍翻译系统之前,我们先来看一下Meta的人工智能学习联盟。

扎克伯格举例表示:目前的AI系统多收到过监督学习训练,也就是说,如果想让系统知道这张照片中是一只猫,就需要明确告诉它,并且拿出几万张猫的图片进行标注,让系统进行监督学习。这些系统有着不错的效果,尤其是用于图像和视频领域,但前提是需要进行大量数据标注的学习过程。

因为在虚拟的三维场景中,环境复杂多变,就像现实环境一样,几乎很难用传统的数据标记法进行监督式学习,因此也就无法支撑自由、随意互动的元宇宙生态。

Meta首席AI科学家杨立昆,也是2018年图灵奖得主,他认为:“自监督学习”可以提供真正的接近人类思维的AI系统。感兴趣的朋友,也建议读一下杨立昆的《科学之路》这本书。

自监督学习的优势在于无需给出数据标注,模型可以从无标注的数据中自我学习,是一种理想的机器学习模型。

目前Meta已经联合13所大学组成联盟,组成了有史以来最大的自我监督学习数据集,目前积累了几千小时的第一人称视频,大家可用于研究在虚拟空间中的任何工作。

3,多语言翻译系统

虽然现在翻译软件已经能够很好的应用到文本中来,YouTube视频也支持提取英文并进行翻译,但是在三维场景中存在同样的问题。

如同我们日常生活,在虚拟场景中与任何人交流时并不会看到文字或字幕,即便是外国人。因此,常规的翻译方案并不适用于三维场景。

扎克伯格表示:目前全球仍有近一半人群无法在互联网上使用自己的语言,例如在中非和西非地区有几百万人的语言在互联网并不流行,只能访问英文或其它语言。

另一个现实是,即便目前最主流的机器学习翻译模型,也只能通过英语作为中转语言,即:将A语言翻译为英文,再将英文翻译为B语言。

而这就会给翻译增加一些噪点和不确定性。为此,Meta推出了开源AI翻译模型:LASER语言工具包。

LASER特点是可以将任何句子转换为其它语言,省去了英文中转步骤,例如A语言可以直接翻译为B语言。

目前,已经支持100多种语言的翻译,并且进行了1400小时的法语、德语、西班牙语、英语之间确定性的语音对齐。这其中的难点包括:口语到书面语的表达形式不同,尤其是少见的没有书面习惯的语言。

为此,Meta也正在开发一套语音到语音翻译系统,即可以实现:A语言的人说话,B语言的人直接收听翻译后的语音。Meta表示:这种方法已经被证明比常规单独语音识别+机器翻译的合成模型要更快。

当然,这类语音到语音的翻译系统,更是为了今后的AR眼镜所准备,届时一套接近人类翻译水平的实时翻译眼镜就。

除此之外,Meta还公布了CAIRaoke,这是一套专为AR虚拟助手开发的AI对话模型,目的是让机器人聊天助手更好的理解你的说话内容,可以更好与你对话,在三维场景中互动。

声明:该文观点仅代表原作者本人,巴拉号系信息发布平台,仅提供信息存储空间服务。

(0)
上一篇 2022年2月25日 01:09
下一篇 2022年2月25日 01:10

相关推荐

  • xp系统现在还能用吗 老电脑XP系统怎么升级Win7

    一、xp系统现状详细介绍xp系统在2014年已经停止更新漏洞修补等技术支持,但用户群体基数相当多,不少电脑配置偏低或者有怀旧情怀的用户还在使用xp系统,期间也有消息称会有360或其他大公司提供技术上的支持,只要小心使用,按照安全软…

    热点 2022年4月27日
    49
  • 通用汽车确认下周量产凯迪拉克LYRIQ电动汽车

    3月16日消息,通用汽车确认将于3月21日开始生产凯迪拉克LYRIQ电动汽车,但并未提及何时开始交付,仅表示将在5月19日重新接受LYRIQ的订单。2020年8月,通用汽车公司推出了全电动中型…

    汽车 2022年3月16日
    33
  • windows7精简版64位与32位的区别是什么?

    如果你问目前市场最新的Windows系统是哪个系统的话,那么大家一定会告诉你是Windows10,但是如果你问目前市场上最好用的系统是什么的话,我想,大部分的朋友还是会告诉你是Windows7。没办法,就如经典的winxp系统一…

    热点 2022年4月26日
    30
  • 手机日期只能设置到2038年?这背后有个大问题……

    世界末日到底是哪一天?这个无厘头的问题一直有着各种各样的离奇答案。当你打开手机,关闭自动设置时间,往未来的方向滑动数字时,你会发现时间停在了2038年。小米、华为可以设置到2037年12月31日,iPhone也只多两天不仅是手机,…

    热点 2022年2月28日
    52
  • 打造北京冬奥村语言服务的工匠精品

    通讯员马德锋薛城科技日报记者何亮24日,北京冬奥村里的外国运动员已离村,服务他们的志愿者也都收拾心情,开启了冬奥会向冬残奥会的转换工作。“一刻也不能停、一步也不能错、一天也误不起”,这是北京冬奥村语言服务团队的信条,由青年…

    热点 2022年2月25日
    38
  • Pixel Watch和Pixel 6a现身运营商库存系统 暗示即将上市

    传闻中的PixelWatch和Pixel6a终于准备好上市了。在一家美国电信运营商的后端库存系统中发现了这两款设备的踪迹,暗示这两款设备可能会在近期发售。库存系统显示PixelWatch代号为“rohan”,共…

    热点 2022年3月2日
    26
  • 怎样给电脑重装系统,怎样给电脑重装系统win7

    怎样给电脑重装系统,怎样给电脑重装系统win7电脑重装系统教程,电脑开不了机,该怎么重装系统呢,今天给大家简单科普下,首先准备如下工具:一台已经完全开不开机的电脑,需要一个u盘大小8g或以上都可以有sd卡的同学们可以拿出自己的sd…

    热点 2022年5月25日
    25
  • 百度将与第三方汽车厂商合作制造无人汽车(百度网盘第三方下载)

    其实,百度做无人驾驶倒不是什么新闻,几个月前就有百度和交通部测试无人驾驶汽车的消息,但是看着这个新闻,笔者还是感觉有些担忧。前不久,沃尔沃的无人驾驶汽车在泊车后突然加速冲向人群,这个惊悚的视频在网上传播,让人们对无人驾驶颇有疑虑。…

    自媒体 2022年7月8日
    20
  • u盘安装win8,u盘安装win8系统步骤

    u盘安装win8,u盘安装win8系统步骤win8系统使用的人不多,很多人基本都是通过u盘重装win8系统的方法使用上win8.有些网友想了解如何重装win8系统,下面小编就给大家介绍一个简单的u盘启动盘制作工具如何重装win8系…

    热点 2022年5月22日
    20
  • 小度爸妈讲故事声音录制方法分享(小度音箱 爸妈讲故事 设置)

    小度是百度推出的一款非常实用的语音助手软件,不仅可以和你聊天,还能获取各类咨询和服务。对于有孩子的家长来说,爸妈只需要录制几个相关的语音包,导入了系统中,就可以通过小度智能设备,为孩子讲故事了,无论爸妈身在何方,都可以随时随地云陪…

    自媒体 2022年8月9日
    69

联系我们

联系邮箱:server#timitao.com
工作时间:周一至周五,10:30-18:30,节假日休息