教人工智能以“我”的视角看世界 让认知能力更像人
2021-11-01 09:11:54 来源: 科技日报
要令人工智能系统如同人类一样与世界交互,人工智能领域需要发展出一种全新的第一人称感知范式。这意味着人工智能在实时运动、交互时,要以第一人称视角理解日常活动。
世界是多维的,生活中同样的景物在不同的视角下会呈现出不同的形态。若要让人工智能更像人类,就要让其视角更接近人。从人类的角度观察环境,人工智能或许会看到一个新的天地。
近日,由脸谱(Facebook)和9个国家的13所大学及实验室组成的学术联盟宣布,11月将开源让人工智能拥有以第一人称视角与世界进行交互能力的Ego4D(Egocentric4DPerception)项目。这个项目包含超过3025小时的第一人称视频,涉及来自73个城市的700多名参与者的日常生活。这些视频将有助于使人工智能认知世界的方式更加趋向于人类。
那么,目前人工智能主要通过哪种视角认知世界,不同视角对于人工智能认知环境会产生哪些影响?人工智能感知环境、认识世界主要通过哪些技术?想要认知世界的方式更像人类,人工智能还需突破哪些瓶颈?
人工智能通常采用第三人称视角
“要令人工智能系统如同人类一样与世界交互,人工智能领域需要发展出一种全新的第一人称感知范式。这意味着人工智能在实时运动、交互时,要以第一人称视角理解日常活动。”脸谱首席研究科学家克里斯汀·格劳曼曾言。
今天的计算机视觉系统大多是利用数百万张以第三人称视角拍摄的照片和视频进行学习的。“为了构建新的感知范式,我们需要教会人工智能像人类一样,从第一人称角度即‘我’的视角,沉浸式观察理解世界,并与之交互,这种认知方式也可以称为自我中心认知。”10月26日,远望智库人工智能事业部部长、图灵机器人首席战略官谭茗洲在接受科技日报记者采访时指出。
如何理解人工智能的第一人称和第三人称视角?谭茗洲解释道:“第一人称视角代入感很强,比如在玩游戏时,你如身临其境,看到的游戏画面就是你真实世界看到的画面。第三人称视角又叫作上帝视角,仿佛你一直飘在角色身边一样,如影随形,可以看到角色本身及周围的情况。例如,第三人称视角下藏在掩体后可以看到掩体前面的情况;而在第一人称视角下,囿于视角范围,在掩体后则只能看到掩体本身。”
“再如自动驾驶,其视觉系统如果只从旁观者的(如车的角度)收集数据,即便通过数十万个基于旁观视角看到的车辆行进图像或视频进行训练,人工智能可能依然不知道如何去做,很难达到现在的自动驾驶水平。因为这种旁观者的视角与坐在车内方向盘前的视角很不一样,第一人称视角下,真人驾驶员做出的反应还包括点刹、猛刹等行为,这些数据是从旁观者视角无法搜集的。”谭茗洲进一步说。
“以前人工智能界很少以第一人称视角收集数据集,这个项目弥补了人工智能视角体系的短板。未来AR、VR的发展十分重要,如果人工智能可以从‘我’出发,以第一人称视角来观察理解世界,将开启人类和人工智能沉浸式体验的新时代。”谭茗洲指出。
克里斯汀·格劳曼也表示:“下一代人工智能系统需要从一种完全不同的数据中学习,即从事件中心视觉而不是边线视觉展示世界的视频中学习。”
建立真实世界数据集
目前让人工智能感知环境、认识世界,建立类人化的认知体系主要通过什么“抓手”展开?
业内专家指出,历史证明,基准和数据集是人工智能行业创新的关键催化剂。今天,几乎可以识别图像中任何对象的计算机视觉系统都是建立在数据集和基准之上的,数据集和基准为研究人员提供了一个研究真实世界图像的实验台。
“脸谱日前发布的这个项目,其实本身就是建立一个数据集,旨在训练人工智能模型更像人类。其开发了5个围绕第一人称视觉体验的基准挑战,即把第一人称视角拆解成5个目标,开展相应的训练集竞赛。”谭茗洲指出。
Ego4D的5个基准是:情景记忆,什么时候发生?预测,我接下来可能会做什么?手—物交互,我在做什么?视听日记,谁在什么时候说了什么?社交互动,谁在和谁互动?
谭茗洲强调,上述基准测试将促进开发人工智能助手所必需的构建模块的研究。人工智能助手不仅可以理解现实世界中的指令并与之交互,同时可以在元宇宙中实现对元宇宙中指令的理解和交互。
为了建立这个数据集,与脸谱合作的大学团队向研究参与者分发了现成的头戴式摄像头和其他可穿戴传感器,以便捕获第一人称的、未经编辑的日常生活视频。项目的重点是参与者从日常场景中捕获视频,比如购物、烹饪、边玩游戏边聊天,以及与家人和朋友进行其他团体活动等。
视频采集了摄像头佩戴者在特定环境中选择注视的对象,以及摄像头佩戴者如何从自我中心角度与人和物互动。到目前为止,摄像头佩戴者已经执行了数百项活动,并与数百种不同的对象进行交互,项目的所有数据都是公开的。
“脸谱这项研究能够更快地推动人工智能领域自我中心认知研究的进步。这将对我们未来的生活、工作和娱乐方式产生积极影响。”谭茗洲表示。
让人工智能认知能力更像人
人工智能发展的终极目标是让人类受益,让我们能够应对现实世界中日益复杂的挑战。想象一下,通过AR设备能够在琴、棋、书、画课堂中准确显示如何弹琴、下棋、握笔和勾勒;形象生动地指导家庭主妇根据食谱烘焙烧烤、烹饪菜肴;健忘的老人借以眼前全息图的帮助回忆过去……
脸谱强调,希望通过Ego4D项目为学术界和行业专家开辟一条全新的道路,帮助构建更智能、更灵活和更具交互性的计算机视觉系统。随着人工智能越加深入理解人类的日常生活方式,相信将这个项目能以前所未有的方式对人工智能的体验进行情境化和个性化。然而,目前的研究还只是触及自我中心认知的皮毛。
如何才能让人工智能的认知能力更像人类?“首先是注意力,人工智能的注意力机制更接近直觉,而人类的注意力是有选择性的。目前来说,大部分人工智能注意力机制,是在训练过程中重复告诉人工智能应该注意哪些地方,哪些东西是有关联的。未来也许可以让参与试验的人戴上特殊的可以捕捉眼球关注点的装置,来进一步收集相关数据。”谭茗洲指出。
“第二,还需要以事件和行为的关联为研究中心,定义人工智能的行为。一件事情的发生包括多个行为,要用人类反馈的方式训练人工智能系统,使人工智能的行为与我们的意图一致。”谭茗洲进一步表示。
谭茗洲强调:“此外,听觉和视觉、语言和行为等之间还需要配合、响应、联动,这就要构建多模态交互模型,纵深研究视角为何会聚焦投向并与意图识别相结合,形成与行为之间联动的机制等。”(记者 华 凌)
为您推荐
精彩放送
热门文章
-
看好拉美业务中长期增长前景 安信国际将伟禄目标价调至18.5港元
-
陆金所控股一季度净利润同比增6.5% 八成新增借款流向小微企业
-
深圳共享单车市场或将重塑 暂不发展互联网租赁电动自行车
-
高管撑股价13家上市银行获增持 后续走势值得期待
-
A股退市名单再添两家 年内退市公司增至25家
-
年内可转债募资超千亿元 募资规模略低于去年同期
-
北交所首家转板公司诞生!观典防务在科创板上市
-
南京银行第4次被股东增持 城商行为何受“青睐”?
-
多家中小银行下调存款利率 存款降息潮是否来临?
-
南下资金持续流入港股 年内增持中海油等43只港股逾亿股
-
降息“靴子”落地!深圳银行均已执行最新LPR报价
-
韦尔股份增持北京君正 增持后累计持有不超过5000万股
精彩图片
-
迄今最具破坏力小行星将掠过地球 飞行速度比高速飞行子弹快20倍
-
全球变暖影响人们睡眠时间 每年平均失去44小时睡眠时长
-
“下一代奇迹材料”石墨炔首创成功 填补碳材料科学空白
-
早期动物五亿多年前已形成复杂生态群落 为寒武纪大爆发奠定基础
-
西藏察隅发现中国最高树 高达83.2米胸径207厘米
-
揭示月背月壤粗细规律!月球表面年龄与月壤内部非均匀性呈正相关
-
长期暴露于野火中的居住人群 脑瘤发病率提高10%
-
研究发现:海草底部蔗糖浓度约比记录高80倍
-
4月苍穹精彩纷呈 群星“成团出道”
-
科学家发现新方法 提高鹿角珊瑚种植成功率
-
湖南首创数字贸易综合服务平台 1.2万家企业入驻
-
研究:每周吃5次或更少的肉与较低的总体癌症风险相关
热文
-
哪些基金是红利指数基金?红利指数基金的好处是什么?
-
车险投保人有什么风险?车险投保人是受益人吗?
-
存货周转率多少合适合理范围是什么?存货周转率小于1说明什么?
-
银行定期存款利率是多少?七日年化2.3%一万一月多少钱?
-
美巢专注家装环保辅料领域,致力于打造室内完美墙面
-
中视酒业供应链十大解决方案突破行业痛点多方共赢!
-
沈腾、马丽今晚做客“蘑菇屋“ 容声冰箱为新鲜美食保驾护航
-
资管机构遭仿冒,hopingclub华英会紧急澄清,请投资者提高警惕
-
QCY AilyPods蓝牙耳机预售10分钟破千台:够小够轻够性价比!
-
坚果投影仪O1和峰米R1 Nano,居家观影必备!
-
轻燃卡卡:轻体健康领域品牌林立,轻燃卡卡凭什么破圈出局?
-
数据表明母婴的风口要来了 选择靠谱的品牌是关键
-
郑明明抗皱凝时胶囊精华有效吗?要怎么用呢?
-
青海省商业性住房贷款利率下调 首套房贷利率调整为4.8%
-
太原多家楼盘已按房贷利率新标办贷 太原市民购房能省多少钱?
-
前5月兰州新区商品房销售面积环比增长约12% 价格同比增2.75%
-
5.26苏州楼市成交稳定 住宅房源共成交34367.37㎡
-
高管撑股价13家上市银行获增持 后续走势值得期待
-
A股退市名单再添两家 年内退市公司增至25家
-
银保监会拟全方位透视险企综合风险水平 全新划分风险等级
-
年内可转债募资超千亿元 募资规模略低于去年同期
-
前四月发放就业补贴超亿元 惠及高校毕业生3.8万人次
-
618选机困难症?一文读懂iQOO Neo6 SE、红米 Note 11T Pro怎么选
-
2022冰箱高峰论坛成功举办,海信真空冰箱获权威肯定
-
股票哪些技术指标最有用?如何设置股票技术指标参数?
-
深港通的标的股有哪些? 什么股票属于深港通?
-
95开头的电话能接不?9521是什么电话?
-
上折和下折什么意思? 现货折盘价是什么意思?
-
余额宝双休日也有收益吗? 零钱通周末有收益吗?
-
深发展信用卡怎么样?信用卡申请进度查询方法是什么?
-
余额宝转出10万要多久?余额宝实时到账吗?
-
乐蜂网创建时间是什么时候?乐蜂网还存在吗?
-
信用卡积分兑换订单怎么查询?5000积分兑换多少话费?
-
国美电器是做什么的董事长是谁?国美有哪些股票代码?
-
腾讯持有快手多少股票?快手与腾讯是什么关系?
-
余额宝一万块钱一天收益多少?余额宝可以当日提现吗?
-
中欧基金刘建平:优化机制和文化 提升专业能力 切实保护投资者利益
-
稻香村集团(山东公司)一行到访山东朱氏药业集团参观交流
-
蓝湾壳寡糖和壳寡糖益生菌 为您保肝护菌
-
品效双赢,“抖音520宠爱季”引领行业加倍“宠爱”
-
朱氏药业集团朱坤福:把握爆品时代机遇、迈进品牌时代新征程
-
招行信用卡借势金融科技,为客户创造更多价值
-
高新科技培育钻石,或掀时尚界新热潮
-
连续四年!用友精智成为国家级跨行业跨领域工业互联网平台
-
北交所首家转板公司诞生!观典防务在科创板上市
-
hoping club华英会成功的十个法则
-
618购游戏神机iQOO Neo6超优惠,至高24期免息+全程价保+保值换新
-
2022年新形象!AMIRO品牌全新视觉升级!
-
贵州酱酒集团“启航”,助力贵州白酒产业产业升级、产区发展
-
赛克斯发布2022年英国度假屋出租市场展望报告