您的位置:首页>>互联网

            语言智能的发展近期又有哪些突破?来听百度王海峰的最新演讲

            发布时间:2019-04-20 17:00:42  来源:互联网    背景:

              “理解和运用自然语言是人工智能的核心问题之一。大数据、机器学习、深度学习和知识图谱等技术的发展,正在给语言与智能的发展带来突破。”4月20日,第十四届中国电子信息技术年会上,百度高级副总裁、AI技术平台体系(AIG)和基础技术体系(TG)总负责人王海峰发表题为《语言与智能》的演讲,以翻译为例介绍了人工智能技术的演进,阐释近期语言与知识技术和大数据、深度学习等技术结合带来的突破、行业应用,以及技术趋势和挑战。

            图片包含 监视器, 室内, 陈列, 电子产品

描述已自动生成

              王海峰是人工智能研究及应用,尤其是自然语言处理领域的领军者,在国内外学界和工业界享有盛誉。他先后为百度开创和发展了自然语言处理、机器翻译、语音、图像、深度学习、数据挖掘、知识图谱等技术方向,带领百度AI取得了大量领先业界的技术成果,并推动百度大脑对外开放赋能,被业界称誉为少有的学术与工程并举的科学家。他主导研发的“百度大脑核心技术及开放平台”,着眼于人工智能的前沿技术研发及大规模产业化应用,打造世界级的人工智能开放平台,助力国家人工智能产业发展,推动各行各业的智能化升级,为国家创新驱动发展战略提供有力支撑,荣获2018年度中国电子学会科学技术奖科技进步一等奖。

              王海峰表示,通俗来讲,人工智能是让机器可以像人一样,具备听觉、视觉、语言、行为能力,可以进行逻辑计算和推理规划,并基于知识学习持续进化。

              语言是人类思考的媒介,是人类特有的高级智力活动。早期的简单符号,到甲骨文,到纸质的书,以及现代互联网上的文本,语言文字这一载体让知识得以凝炼和传承,可以说,语言文字促进了人类文明的发展。因此,如何理解和运用自然语言,是人工智能需要解决的核心问题之一。当下,大数据、知识图谱、机器学习、深度学习等技术快速发展,并与自然语言处理密切结合,推动语言智能持续发展和突破,并越来越多地应用于各个行业。

              自然语言处理是人工智能皇冠上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理最典型的应用技术之一。王海峰在这一领域深耕近30年,他从亲历的机器翻译发展史中以小窥大,梳理介绍了人工智能技术的发展和演化历程。

              从现代计算机诞生之初,就开始有人提出用计算机来进行语言翻译的设想。在早期发展过程中,研究者们很多采用理性主义、规则系统、知识工程的方法来进行研究。王海峰从1993年开始从事机器翻译的相关研究,初期便采用基于规则的方法,在国家“863”评测获得第一。早在1999年,王海峰在博士论文中即开始探索神经网络机器翻译的可能性,但由于当时算力和数据的制约,他转而尝试统计机器翻译与大规模规则翻译系统的结合,并开创性地提出枢轴语言翻译方法以解决小语种翻译语料稀缺的难题。2008年,王海峰主持研发的统计机器翻译系统参加了国际口语机器翻译评测比赛IWSLT,在所参加的 5项任务15个评测指标中,共取得12项第一、3项第二的优异成绩,展露出明显的技术领先优势。

              2010年加入百度后,他带领团队融合统计与规则、实例和神经网络等方法,实现了多方面的技术创新,打造出服务亿万用户的百度翻译,并在2015年率先发布互联网神经网络翻译系统。目前,百度翻译可支持全球28种语言互译,覆盖756个翻译方向,超过15万家第三方应用接入百度翻译API,每日翻译字符数超过千亿。百度翻译因此荣获2015年国家科技进步二等奖。2018年的百度世界大会上,百度又发布了世界上首个集成了预测和可控延迟的语音实时翻译系统,这是自然语言处理方面的重大技术突破。

              王海峰表示,机器翻译的发展从最初运用规则系统,到统计的机器学习方法,后又解决算法、算力等各方面的问题,不断登上新的台阶。人工智能的发展脉络与此相似,经历多种方法的探索和实践,有过低谷和高潮,总的趋势是在持续进步。

              近年来,深度学习的崛起,及其与大数据的结合,使人工智能得到飞跃式的发展。

              在自然语言处理领域,深度学习模型具有比传统机器学习模型更强的数据学习能力,使得基于深度学习的依存句法分析等自然语言处理系统准确率得到大幅提升。

              目前,深度学习领域主要有强化学习、监督学习、无/自监督学习三种学习范式,而无/自监督学习可以类比人类学习,是重要的一种学习方式。

              自监督学习让基于大规模无标记语料的语言模型得到了长足的发展。近期, Google、百度分别提出了无监督文本的预训练语言模型BERT、ERNIE,将NLP任务的性能提升到新高度。百度提出的基于知识增强的ERNIE 模型,通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。相较于Google BERT基于字单元的语义建模,ERNIE直接对先验语义知识单元进行建模,并通过海量文本数据学习实体间的语义关系。这种融合知识的语义建模大幅增强了模型语义表示能力,在包括语言推断、语义相似度、命名实体识别、情感分析、问答匹配等自然语言处理各类任务上的多个公开中文数据集上,ERNIE均取得了优于BERT的效果。

              依托深度学习技术的发展,语音、图像等感知技术取得了巨大进步,但认知技术的突破,会越来越依赖知识,需要提升对知识和大规模知识图谱的运用。在物理世界、人类社会和网络空间中,汇聚了大量的多元、异构、多模态的数据,百度借助无标签大数据开放域知识挖掘、知识体系自动扩展、知识整合等技术,基于海量数据构建起了超大规模知识图谱。目前,百度拥有世界上最大的多元异构知识图谱,除了包含数亿实体、千亿级事实,能够满足90%用户需求的实体图谱,针对不同的应用场景和知识形态,百度还建立起关注点图谱、行业知识图谱、POI图谱、事件图谱等多种知识图谱。比如在医疗领域,能够从病历等原始文本中,抽取出实体及多元关系,并进行文本结构化,最终构建起医疗图谱,同时结合医疗大数据、医疗认知计算,应用于医疗临床辅助决策服务中。

              多模态知识与语言、视觉等技术结合,发展进入“多模态深度语义理解”阶段。例如,基于知识图谱的视频理解技术,能够视频中抽取结构化语义知识,真正“看懂”视频。

              语言理解技术持续发展,并通过与知识图谱、深度学习等技术融合,不断提高各种应用的智能化程度。

              王海峰在演讲中介绍,百度创新地融合知识图谱、自然语言处理及深度学习技术,研发了能够深刻理解用户意图、精准满足搜索需求、提供更丰富知识内容的智能搜索引擎,并结合语音、图像、AR等感知技术能力,更便捷地与用户交互,为用户提供更精准高效的信息服务。

              例如,用户用自然语言搜索“林徽因的丈夫的父亲是谁”,智能搜索引擎能够理解用户的意图,并结合知识图谱以图文并茂的形式把答案“梁启超”精准呈现给用户。又如,用户搜索“上面草字头下面句子的句是什么字”,智能搜索引擎能够为用户提供“苟”的读音、笔画、释义等丰富的信息。

              除了智能搜索方面的应用,百度还基于语言理解和生成技术提供智能写作等能力。智能写作适用于财经、体育、天气、热点与娱乐事件等多领域的辅助与自动写作,大幅提升创作效率。比如,基于结构化的股票数据,可以生成关于股市的快讯新闻。结合视觉技术的智能春联,可通过刷脸检测出人物性别、年龄、微笑程度、性格特征等,生成特征词,然后基于神经网络生成技术创作出应景的春联,让人工智能技术融入大众的文化娱乐生活。

              智能客服是结合自然语言处理、知识图谱和语音等技术打造的行业解决方案。在智能客服场景中,基于语音语义一体化技术,百度大脑可以准确识别出用户的话语,理解用户意图,进而通过行业知识图谱的赋能理解业务流程,为用户提供相应的服务。整个服务过程流畅自然,实现了与用户无障碍沟通,提升业务效率并满足用户需求。

              百度领先的语言与知识技术,不仅广泛应用于智能搜索、深度问答、对话系统、智能写作、机器翻译等领域,为广大用户提供更智能的体验,满足用户对信息和服务的需求,还通过百度大脑平台全面开放,促进行业应用和创新。

              当然,自然语言理解技术也面临着数据稀疏、知识未被有效利用、结合场景的语用研究等挑战。但王海峰表示,“随着技术发展,我们会越来越深入地理解自然语言、掌握知识,推动人工智能发挥更大的价值,为人类社会发展提供更大的助力。”

            特别提醒:本网内容转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。


            返回网站首页 本文来源:互联网

            本文评论
            AI让每一步都成为增长点,金投赏+百度大咖告诉你AI营销的秘密
            越来越多的营销人发现,营销从未像今天这样富有挑战:媒介渠道和用户注意力空前碎片化,传统广告创...
            日期:10-19
            擎朗送餐机器人出席第三届杭州智博会 火爆全场杭州吃货馆
            说起国际智能产品博览会,你想到了什么?特聘专家、学者、行业大佬?数字经济、人工智能、产品投资?论...
            日期:10-18
            “110”网络扶贫创新活动助力礼县苹果热销,1274名贫困人口受益
            近日,国家市场监督管理总局、农业农村部信息中心和字节跳动扶贫联合发布了甘肃礼县扶贫成果。字节...
            日期:10-18
            万门教育:为教育搭建“高铁”,将优质在线课程传递给更多的孩子
            互联网近年来发展迅速,从O2O到移动支付,从出行到饮食,互联网以前所未有的深度塑造着每一个席卷的...
            日期:10-18
            回首协同应用大赛9年 | 我们是见证者,更是参与者
            风雨夏秋冬,九年磨一剑。不知不觉,致远互联举办全国协同应用大赛已有九载。时光飞逝,或许你已记...
            日期:10-18
            赛车手的好搭档,拉力赛冠军选择「瀑布洗」热水器
            赛车手的沐浴难题
              我是邓晓文,是一名职业赛车手,曾获得中国拉力锦标赛的冠军。从小热爱...
            日期:10-18
            创蓝:改变繁琐的工作,人工智能OCR来了!
            随着科技的发展,人工智能早已渗透进各个领域和行业,尤其是人工智能技术,在近几年逐渐被广泛应用...
            日期:10-18
            5G视频彩铃来了
            (原标题:5G视频彩铃来了:个人、企业可随意定制)
            日期:10-18
            2020年的开发人员关键词:开源和远程办公
            外媒 TechRepublic 近日就2020年开发人员所需的技能,对Digital Ocean工程副总裁Al Sene进行了访谈...
            日期:10-18
            透过全球最流行互联网简史 看最强的中文网站百度
            互联网简史,就是一部风云变幻史,从1996年到2019年,有的网站倒下了,而新生网站也层出不穷。近日...
            日期:10-17
            中移动AR文物展示系统惊艳长春航展,富媒体形式讲述文物故事
            人机可交互,文物能交流。10月17日,庆祝人民空军成立70周年航空开放活动·长春航空展如期举行...
            日期:10-17
            双十一买投影划算吗?推荐三款高性价比投影,再不收藏这手可就保不住了
            吼~一年一度双十一又要到了,大家都准备好买买买了吗?反正我已经开始午休加购物车,上厕所加购物车...
            日期:10-17
            中国证券市场研究学者布娜新:预见大时代的领航者
            在风起云涌的资本市场中,能够紧跟趋势冷静决策的人当属凤毛麟角。类似新三板这样的新生事物,大部...
            日期:10-17
            即信云通信参加中国车联网大会 助力智慧交通新时代
            日前,由国家工信部、深圳市人民政府联手主办的中国车联网产业展览会于深圳会展中心盛大召开。玄武...
            日期:10-17
            新华三助力教育行业构筑主动安全,护航智慧校园创新变革
            近日,在2019合肥网络安全大会期间,紫光旗下新华三集团与安徽大学共同举办了数字校园安全论坛,众...
            日期:10-17
            优化管理与放映品质两手抓,不重规模只重品质
            2019年,中国电影市场逐渐进入调整期。作为电影市场链条的终端窗口,不同地区影院的经营状态也出现...
            日期:10-17
            聚力创新,群智合助力行业走向“云化未来”
              企业数字化的时代已经来临,各行业面临智能化、云端化的升级。2018年2月工信部印发了《推动企业上云...
            日期:10-17
            海思首次外卖4G通信芯片
            (原标题:海思首次外卖4G通信芯片 麒麟依然只供华为使用但考虑对外销售)
            日期:10-17
            相聚Intel物联网合作伙伴峰会 杰和科技与行业伙伴共谋发展
            10月16日,2019英特尔人工智能物联网生态合作伙伴峰会在厦门举行,峰会以“智IN万物,识微见远...
            日期:10-16
              专栏介绍
            张玉翠 的专栏
            张玉翠发表的文章
            积分:
            自我介绍 :
             
            福彩18选7是什么_体彩5+1哪个好-山东十一运夺金是真是假 华中第一楼停工| 俄向叙增派武器| 第一剪傅正义逝世| 韩国宰5万头猪| U盘20年专利到期| 北理工80后副校长| 红谷滩凶犯获死刑| 张琳芃微博被围攻| 印尼海域发生地震| 马云再谈悔创阿里|