【世界聚看点】语言智能的新发展与新挑战
2023-02-20 10:09:27 来源: 光明网
语言智能是人工智能的一个领域,主要关注人类语言的智能分析和处理,涉及语音识别、自然语言理解、自然语言生成、机器翻译等领域。近日,最能体现语言智能水平的ChatGPT引发各界的广泛关注,人们怀着极大的兴趣在讨论和尝试着这项崭新的技术成果。或兴奋,或迷茫或恐慌。兴奋的是语言智能技术真的使计算机能像人类一样和我们自如地聊天解惑了,并且话语自如、有理有据,可以拒绝不合理的提问,效果如此之好,竟引发了轰动效应;惶恐的是ChatGPT具有超强的生成能力,不仅可以聊天,还可以写文章、作诗、编码程序等,这样的话,ChatGPT就会代替人类和语言相关的工作和岗位,给人类生活带来颠覆性变化;迷惑的是我们的语言智能研究下一步朝着哪个方向走?如何理性地分析ChatGPT取得的突破和主要不足?赶上或超越它的机会和落脚点在哪里?对于语言智能的飞速发展,我们要有科学理性的态度,既要热情拥抱人工智能的新发展,让它更好地服务于人类社会,又要预防它带给我们的消极影响,看到我们的不足和差距,迎头赶上。
一、ChatGPT的功能与不足
(资料图)
ChatGPT是由openAI研发的一种人工智能聊天机器人程序,它是基于GPT3.5架构的大型语言模型并通过强化学习进行训练,可以和人类以自然语言对话的形式进行交互,还可以用于相对复杂的语言工作比如文本生成,自动问答,自动摘要等,同时具备一定的编写和调试计算机程序的能力。ChatGPT 的出现是语言智能领域的一大进步,标志着语言智能技术可以融合于信息搜索、人机交互、对话生成等方面,应用场景的落地具有广阔空间,潜力无穷。
首先,ChatGPT是一个基于深度学习的大规模预训练对话模型,主要功能是对话聊天,它通过强化学习来理解提问者的话语意图,能够较好地引入人类反馈,具备主动承认错误,区分问题是否符合伦理要求,质疑不正确的问题等,并通过清晰的逻辑思路来组织话语,距离人类的聊天方式和口气越来越近。相对于以前的对话系统,ChatGPT的主要突破在以下几点:
(一)超强的生成能力可以完成多种任务。ChatGPT除了与人对话聊天外,还能按照输入的关键词和表达的意图写小说、写论文、创作诗歌、作图、编写和纠正程序代码。还可以用在教案生成、资料查询、智能教学、智能创作和设计,在医疗、法律、教育、咨询服务等领域具有广阔应用前景。
(二)与搜索引擎相结合,基于海量数据,实现更为符合人类需求的查询结果,实现交互式搜索,给用户带来全新的体验
(三)交互能力大幅度提升。除了具有广博的知识,它还能很好地组织自己的话语,思路清晰,逻辑严密,“因此”“而且”“但是”等话语连接词使用恰当,几乎接近人类语言的能力。还能主动承认错误,拒绝不合理的提问等等。
ChatGPT的主要功能在于提供信息和社交能力,有望成为人在精神陪伴,面对挫折困难的时候提供引导和安慰的帮手。总之,ChatGPT已经成为互联网时代的语言智能的技术领跑者,给人类社会带来更加智能化和便捷化的服务。
当然,作为一种新兴人工智能模型,ChatGPT也存在一些问题和不足,主要在于:
(一)尽管对话能力和交互能力大幅度提升,但经常出现事实性错误。由于它是数据驱动的模型,对于数据背后的真实世界的状态,原理和规则等缺乏足够的认知,因此会出现一本正经地胡说八道情况。不符合常理的话语会经常出现。
(二)对于一般知识了解广泛,但无法提供专业性较强、有深度、有洞见的问题答案。例如对它进行物理学测试,简单常识性问题回答较好,越是难度增加,答案不能令人满意。说明ChatGPT掌握的知识并不深入、不专业。
(三)基于多层复杂神经网络搭建的深度学习模型,目前还不能解释其算法逻辑,经常出现事实性错误,产出的结果不具有安全性保障。如果被恶意利用,将造成严重的安全隐患,或危害法律。
二、ChatGPT 的工作范式
ChatGPT是一个基于transformer神经网络架构和生成预训练技术的大型语言模型,通过对超大型文本语料的训练,来获得语言知识和世界知识。同时它还引入基于人类偏好的强化学习方法,将其应用于自然语言建模。训练的语料,除了海量无标注数据,ChatGPT还利用标注精细的专门语料库,训练机器更高的适应性和更准确的知识。这些知识是怎么被机器获得和输出的呢?ChatGPT使用的transformer神经网络结构对数据进行训练,可以输入序列,将其转化为对应的输出序列,知识是通过神经网络训练得到的。在训练过程中,ChatGPT使用了海量的自然语言文本数据来学习单词的嵌入表示,以及上下文之间的关系,这些知识被编码在神经网络的参数中,输出的结果都生成于这些参数之中。收到用户的问题时,ChatGPT会将其输入到神经网络中,神经网络会根据它学到的知识回答问题,反馈给用户。超强的记忆力是它的重要特征。ChatGPT作为一个现象级的技术产品,在生成内容方面无疑是革命性的,代表着人工智能大模型加大数据范式方法的成功,也说明采用统计模型方法模拟人类语言智能的新发展。ChatGPT在大模型的基础上,采用人类反馈强化学习的训练机制和提示引导模式,促使模型逐渐顺应人类思考逻辑,趋向人类认知和习惯,这是它的一大创新。
三、对未来语言智能走向的影响
ChatGPT除了对人类生活带来影响,对语言智能领域的研究范式和发展走向也会带来巨大的冲击。从大量的语言数据中学习,挖掘语言规律和语义关系,极大地改进了自然语言理解和生成的质量,取得惊喜的使用效果,使我们对大语言模型有了新的认知和思考:大模型范式是否成为未来语言智能的主流技术?学术界和企业界从事多年的自然语言处理研究还需要继续搞下去吗?ChatGPT会给AI领域的研究带来怎样的影响?
预训练模型的出现代表了自然语言处理技术的飞跃,减少了对特征工程的依赖,逐渐带动整个领域研究范式的转变。这种范式转变带来的影响主要体现在:
一是自然语言处理研究子领域的逐渐弱化,例如词性标注、命名实体识别、句法分析、指代消解等问题,它们在大模型+大数据独领风骚的背景下,将会逐渐失去吸引力,甚至被淡忘和遗弃。
二是自然语言处理不同子领域的技术方法和技术框架日趋统一。多少年来,为了让机器理解人类语言,人们想尽各种方法来标注词性,理解语义。ChatGPT的出现,让人们看到了语言预训练模型威力,通过这种范式处理自然语言效果会更好。
第三,从全球语言智能的发展来看,大模型范式的一路领航势必导致技术、资源、用户的高度趋合,最终走向技术和资源的单极垄断。
四、未来发展
尽管ChatGPT在智能交互方面获得惊人的能力,但它毕竟是一个预训练语言模型,基于预存知识和模型回答问题,并不具备真正的理解能力和创造能力,不能理解自己输出的内容。面对语言智能的新发展和新挑战,未来可以着重考虑以下几个着力点。
(一)深度学习模型的优化。结合人类语言习得,语言使用规律和习惯,推进深度学习模型研究,提高语义理解能力,更好模拟人类语言能力。
(二)多模态语言理解与生成。随着多模态数据的不断增加,如何在多模态语言理解任务中有效融合多种信息来源,提高语言理解的准确性是当前语言智能研究的一个重要方向。ChatGPT主要是文本的自动生成,多模态的语言理解和生成问题尚未完全解决。需要未来深入研究多模态学习和多模态生成技术。
(三)领域知识图谱的构建。虽然ChatGPT可以搜索众多信息,对一般问题回答较好,但相对有深度和专业性较强的问题却表现得力不从心。如何更好地利用知识图谱的语义信息,提高自然语言处理任务的准确性,更好地服务于各类专业性用户,也是未来可以发展的一个领域。
(四)加强人工智能伦理和数据安全等问题的研究。ChatGPT是生成型人工智能,不是简单地分析和处理数据,很可能会引发道德和法律方面的违规行为。比如,对信息数据来源无法进行事实核查,存在个人数据和商业秘密泄露,或提供虚假信息的隐患。学生使用ChatGPT写论文是否算抄袭等等,因此加强科技伦理研究,建立数据安全法规的约束机制,增强人们对技术变革的现代智慧是非常迫切的任务。
作者:李佐文,系北京外国语大学人工智能与人类语言重点实验室教授、博士生导师
标签: ChatGPT
为您推荐
精彩放送
热门文章
-
每日速讯:长虹宣布接入百度文心一言能力打造大屏8K人工智能全系产品和服务
-
今日热议:方正富邦基金乔培涛:重点挖掘困境反转行业和新技术新产业投资机会
-
焦点快看:这个氢能的细分赛道也值得关注|行业发现
-
当前热讯:罗永浩交个朋友回应被曝欠薪
-
全球快看:大浪淘沙,爱驰汽车未上岸
-
全球最新:每日财报|吉峰科技定增申请获批 TCL中环拟41亿投资单晶硅项目
-
每日财报|华夏幸福联席总裁孟惊涉嫌违法犯罪
-
机器人独角兽转战港股:11岁的优必选仍患资金饥渴症
-
信达澳亚当家顶流冯明远要离职?东家欲培育新人
-
【全球报资讯】卖“基金”亏损被判赔偿30万,代销机构应该如何做?
-
【世界热闻】由宁波银行主承 全国首单碳资产转型债券正式发行
-
世界快资讯丨KK集团再战港交所:从轻资产转为重资产,如何解决盈利难题?
精彩图片
热文
-
当前视点!超4万人遇难!土耳其强震,超8万栋建筑倒塌!65人被羁押待审
-
热议:易方达上证50指数证券投资基金(LOF)(易方达上证50指数(LOF)A)基金产品资料概要更新
-
每日焦点!易方达中证全指证券公司指数证券投资基金(LOF)(易方达中证全指证券公司指数(LOF)A)基金产品资料概要更新
-
易方达中证国有企业改革指数证券投资基金(LOF)(易方达中证国有企业改革指数(LOF)A)基金产品资料概要更新
-
世界报道:易方达中证军工指数证券投资基金(LOF)(易方达中证军工指数(LOF)A)基金产品资料概要更新
-
世界讯息:长安基金管理有限公司关于长安泓源纯债债券型证券投资基金下调基金管理费率并修改基金合同、托管协议的公告
-
全球讯息:2023年电解铜行业投资分析
-
天天热资讯!2023年电解铜行业竞争分析
-
天天新动态:2018年6月:全国各省市新闻纸产量排名,山东省当月产6.89万吨登顶
-
2018年6月:全国各省市乙烯产量排名,广东省当月产25.41万吨登顶
-
速递!2018年6月:全国各省市合成洗涤剂产量排名,广东省当月产19.64万吨登顶
-
环球要闻:美官员:美国暂无计划结束对乌援助
-
世界热消息:巴基斯坦旁遮普省两车相撞事故已致12死62伤
-
[小鲨帮选车]一汽丰田亚洲龙购车指南外观惊艳
-
2023年02月18日全国豆蔻报价分析
-
2023年02月18日全国紫薯报价分析
-
【环球新要闻】2023年02月18日全国菜籽报价分析
-
2018年5月:全国各省市焦炭产量排名,山西省当月产799.1万吨登顶
-
2018年5月:全国各省市发电产量排名,广东省当月产429.3亿千瓦时登顶
-
观察:开年首场!金融街论坛系列活动——“科创中国 金融赋能”融资交流沙龙活动举办
-
中国科幻研究中心2023年会在京召开
-
全球短讯!母乳的味道小说_母乳的味道
-
全球今热点:2023年02月18日全国鸡蛋报价分析
-
世界百事通!2023年02月18日全国栽培基质报价分析
-
快资讯丨古巴专家:破坏“北溪”管道 美国获益最大
-
中国汽车加速“出海”与世界共赢
-
天天热点!巴基斯坦达苏水电站顺利截流
-
全球观速讯丨佩斯科夫:西方不太可能支持普京与拜登会见
-
当前视点!美国田纳西州发生枪击案 造成1人死亡
-
2023年2月19日福建省六偏磷酸钠价格最新行情预测
-
2023年02月18日全国茶树苗报价分析
-
世界观天下!2023年02月18日全国芋头报价分析
-
当前聚焦:2018年5月:全国各省市液化石油气产量排名,山东省当月产106.9万吨登顶
-
全球今热点:2018年5月:全国各省市石油焦产量排名,山东省当月产59.8万吨登顶
-
跨国企业在中国丨美敦力上海工厂:常年“全球最佳”,加速推进本土化造福更多中国患者
-
2023年02月18日辽宁省蔬菜报价分析
-
世界即时看!2023年02月18日湖南省中药材报价分析
-
【新要闻】2023年02月18日湖北省中药材报价分析
-
当前热文:2018年5月:全国各省市燃料油产量排名,山东省当月产95.9万吨登顶
-
全球短讯!2018年5月:全国各省市石脑油产量排名,广东省当月产42.9万吨登顶
-
全球观热点:又曝光了!日本男子在拉面店抓起筷子舔后放回,日网友:投毒!
-
【环球时快讯】印度狂买俄石油,激增近400%!
-
最新快讯!美前情报官员:美国是北约头号威胁 为己私利捅盟友刀子
-
环球通讯!俄受损货运飞船坠入太平洋
-
【当前热闻】土耳其灾害应急管理局:强震后共发生6040次余震
-
全球微动态丨我的世界codechickenlib_codechickenlib是什么
-
环球速看:2023年02月18日全国普洱报价分析
-
观焦点:2023年02月18日全国菠菜种子报价分析
-
每日速读!2023年纪录片行业技术特点分析
-
2023年电解铜行业技术特点分析