• 联系我们
  • 地址:北京市三环某某楼2201室
  • 电话:18911603110
  • 传真:010-68888888
  • 邮编:471000
  • 当前所在位置:首页 - 阅读培训
  • 2020语言与智能技术竞赛:云知声认知智能团队获机器阅读理解任务冠军
  •   11月6日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办的“第五届语言与智能高峰论坛”在线语言与智能技术竞赛”五大任务领域优秀团队授,凭借在阅读理解技术方向的深厚积累,云知声认知智能团队摘得机器阅读理解任务冠军牌。

      “2020语言与智能技术竞赛”由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会中文信息技术专委会联合承办,设立机器阅读理解、面向推荐的对话、关系抽取、语析与事件抽取五大热门竞赛任务,并提供面向真实应用场景的大规模数据集。

      今年的参赛规模创历年新高,五大任务领域累计报名参赛队伍超5300支,参赛选手超6000人,大赛累积收到有效提交结果近15000份,成为中文NLP领域参赛人数最多的赛事。除整体参赛人数规模翻倍之外,参赛队伍阵容亦堪称豪华,覆盖了知名高校、科研机构以及诸多知名企业。

      作为本次竞赛的核心任务之一,机器阅读理解 (Machine Reading Comprehension)是指让机器阅读文本,然后回答和阅读内容相关的问题。阅读理解是自然语言处理和人工智能领域的重要前沿课题,对于提升机器的智能水平,使机器具有持续获取知识的能力等方面具有重要价值,近年来受到学术界和工业界的广泛关注。本次大赛机器阅读理解评测是连续举办多年的一个任务,吸引了包括中国科学技术大学、中国科学院大学等一千多支知名校企队伍参加。

      本次大赛的机器阅读理解任务注重阅读理解模型在真实应用场景中的鲁棒性,挑战模型的过性、过稳定性以及泛化能力。比赛过程中,云知声认知智能团队依托自身雄厚的技术积累,以及在医疗等领域的产业化实战经验,所提交系统取得F1值较基线%的佳绩,在预赛和复赛F1值和EM值在均位列第一。

      比赛中,云知声认知智能团队针对阅读理解系统存在的过、过稳定和泛化性不足三个问题进行了有针对性的优化,增强了阅读理解系统在真实场景中的鲁棒性;团队还借助云知声预训练语言模型平台UniPLM,对模型进行了快速迭代和高效训练;最后利用模型集成的方法进一步提高了阅读理解模型的性能指标。

      1. 利用数据增强的方法来处理过、过稳定问题。针对过问题,使用问句生成和相似度匹配模型两阶段过程后生成候选样本,用来训练好的阅读理解模型,若成功则生成过类型的增强样本。针对过稳定问题,使用实体识别方法从文章中识别与答案相关实体,与问句信息结合融入篇章中生成候选样本,用来训练好的阅读理解模型,若成功则生成过稳定类型的增强样本。

      2. 利用领域外数据来增强模型的泛化能力。增加了包括DuReader、CMRC等通用领域的语料。还增加了证券公告、五种学科的教育领域数据。

      3. 借助云知声预训练语言模型平台UniPLM来进行模型的快速迭代和高效训练。UniPLM基于Huggingce的transformers库进行开发,支持各类主流的预训练语言模型以及分类、序列标注、阅读理解等NLP任务。UniPLM融合了TensorBoard和微软NNI框架,支持可视化训练和自动调调参。它还可以高效地在分布式训练平台Atlas上进行多机多卡训练。

      让机器理解人类语言是人类长期以来的梦想,也是人工智能应用必须迎接的挑战。作为云知声全栈技术版图的重要模块,经过多年的持续投入与潜心研发,当前云知声认知智能技术已处行业领先水平,由云知声与中科院自动化所合作完成的项目“大规模知识图谱构建关键技术与应用”亦荣获2019年市科学技术进步一等。相关技术也已先后应用至医疗、家居、车载等诸多垂直领域。

      特别提醒:本网内容转载自其他,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容您的权益,请及时联系我们,本站将会在24小时内处理完毕。

      限量4折宽带还不抢?速来薅电信的羊毛!全生态新设计,解密华为IdeaHub的工业美学本文评论不惧时疫,亦敢为先丨白鸽在线荣获福建省…三月和煦的微风吹开了初春的新篇章,大地跨过凛冬的严寒呈现出一片欣欣向荣的景象,但身处暖阳下的...[详细报道]日期:03-23科大讯飞携消金木水火土命查询表费者产品亮相AWE 以人工智能…阳春三月,微风拂面。黄浦江畔正式进入“AWE时间”。阔别两年,以“新十年...[详细报道]日期:03-23吃货的“吃饭分钱”是“伪需求”…“14亿人口,每个人都要吃饭”!餐饮行业自然成为国内消费的拉动力,具备极高的行业规模,...[详细报道]日期:03-23多家券商上调腾讯目标价 国内外投行坚定…春节后在全球流动性逐步收窄、市场印花税调整等外部因素的扰动下,股市出现调整。港股热门...[详细报道]日期:03-23雅迪电动车年销1000万辆,背后藏着啥秘密2019“新国标”实施后,伴随着两轮电动车行业集中度的进一步提升,以“更高端&rdquo...[详细报道]日期:03-23百度爱采购最新品牌宣传片,让你遇见更多…打开百度输入法,再打开百度APP,输入“chong qi”,排在前三位的分别是“重启&rdqu...[详细报道]日期:03-23占据5G市场先机的联发科,在用AI下一盘什…5G+AI已成为手机行业的发展方向,除了手机品牌厂商的推动外,更离不开上游供应链的技术支持。目前市...[详细报道]日期:03-22百合佳缘婚恋观报告:近五成未婚男女更注…3月12日,百合佳缘集团发布婚恋观报告《单身男女结婚那点事》(下称《报告》)。《报告...[详细报道]日期:03-22知乎冲刺美股上市 老虎证券任承销商0费用…3月20日讯,知乎向美国证券交易委员会(SEC)提交了更新后的红鲱鱼招股书,计划在纽约证券交易所挂牌...[详细报道]日期:03-22模型优化难?百度智能云EasyDL模型评估全…近些年深度学习持续发展,在视觉、自然语言处理、语音等各个技术方向都诞生了创新智能应用,例如智...[详细报道]日期:03-22环保启蒙动画《环保特攻队》播放量破两千…欢迎跟随环保特攻队的步伐,进入二次元的美丽泗洪世界。自《环保特攻队》以来,各位观众家长和...[详细报道]日期:03-22韩媒:京东方将首次为三星智能手机提供 …3 月 22 日消息 据韩媒 ETNEW 报道,中国最大的显示器制造商京东方正准备首次为三星电子的智能手机...[详细报道]日期:03-22走,移动云带你和技术大牛们「TeaTalk」…2020年,移动云TeaTalk走过六城,技术的碰撞、精彩的“云言云语”皆令人印象深刻。2020年...[详细报道]日期:03-22海信AWE集中队伍“主场秀肌肉”,“Hi,…作为新晋的全球三大家电与消费电子展之一,一年一度的中国家电及消费电子博览会(AWE2021),将在3月2...[详细报道]日期:03-22打击异常流量,看国双大数据和人工智能技…近日,国双在中国广告协会的指导下,重磅发布了《国内互联网异常流量2020》。根据国双Ad Diss...[详细报道]日期:03-22新生(原爱回收)快手直播首秀屡创佳绩快手直播带货已经成为很多消费者购物的新途径,但低客单价的商品一直倍受消费者喜爱,但3月19日的一...[详细报道]日期:03-22辛巴“消失”的近100天:一家直播电商头…2020年,直播电商一狂奔,成长为“万亿级”的大市场,根据艾媒咨询的预测,2021年直播...[详细报道]日期:03-22开言英语WeMeet活动讨论“凡尔赛”文学,…每周,开言线下WeMeet英语角活动都会在不同的城市进行。上周,武汉、深圳、南京、、上海、沈阳...[详细报道]日期:03-22博今国际2021春茗会暨代理行答谢会举行3月18日,为答谢各大代理机构长期以来的信任与支持,博今国际2021春茗会暨代理行答谢会在博今国际5...[详细报道]日期:03-22一支“幸福力”短片火了,各大主流疯…引入:

      本网站LOGO小熊标志受版权,版权登记号:鲁作登字-2015-F-025467,未经ITBEAR许可,严禁使用。