每日最新
当前位置:500万彩票网 > 业界资讯 >

中文最佳哈工大讯飞联合发布全词覆盖中文BERT模型

发布时间:2019-07-10 类别:业界资讯

  近日…=,哈工大讯飞联合实,验室发布了基于全词覆盖的中文 BERT 预训练模型•◁=,该模型在多个中文数据集上□•■◆•,取得了、当前中▽○▪•●,文预●☆☆。训练模!型的最佳水”平,部分效果甚至超过了原版 BERT、ERNIE等中文预训练模型▷=•■◇。。

  这“一新。的模型资源▪▼-☆▼,极大,地推动○………●△。了中文:自然“语言处理的研!究•-☆◇=?发展,弥补了之前该研究模型在中文自然语言▲…•☆、处理。上的空缺☆▽…◁◆。之前 ERNIE 更多使用百度百科、贴吧等网。络数据,它对非正式文本(例如微博□▽◆;等)建模较好◇▪☆-,而B“ERT-wwm使用了中文维基百科(包括简体和繁体)数据进行训练☆…▪,故此对!正式文本建模更有优势☆★-★=•,同时BERT-wwm也能更好的处理繁体中文数据,因为 ERN△▷☆-▽、IE 的”词表中◇▲,几乎没有繁体中文,让业界多了一个选择。

  哈工大讯飞联合实验室(HFL)是科大讯飞重点引进和布局的核心研发团队之一,由科大讯飞AI研究院与哈尔滨工业大学社会计算与信息检索研究中心(HIT-SCIR)在2014年共同创办。

  自哈工大▪☆□。讯…-□■-!飞联合实验”室成立,双方一直进行着深入地合!作◆◁▲▼,特别是语言认知计算领域,成果显著▲□…▼,研究!涉及阅读?理解、自动阅卷、类人答题▼☆•、人机对话、语音!识别○◆□”后处理★●=△-★、社会舆情,计算等、前瞻课题,相应!研究成果■△•-▲!应用”于司法●◇▪□,教育等领!域。哈工大讯飞联合实、验-◇●、室在近几年获得多项;世界冠军,其中包括机器阅读理解权…★、威评测SQuAD、SQu,AD 2.0-○,第五届中文语法错误自□=☆…“动诊断大赛CGED,对话型阅读理解。评测CoQA▷▼☆、QuAC等。

  此次发布的基于全?词覆盖的中文BERT,不仅表明科大△△◁▼“讯飞在自!然语▼=;言处理技”术上保持!业界领先水平,同时还积极将最新技”术转化应用到中文自然语言处理的研究中●▷☆◆•,与业界一同推进中文自然语言处理的研究与发展▪◆,为中文信息处理做出更多贡献。

  AI蓬勃▪•●•△”发展…●▼▽•,人工智能要求的是不仅要“能听会说…★”•▽,还要“能理解、会思:考”,这一▽-,技术跨◆◇”越,需要大量▽=,科=◆!学研◆▷▽=▷,究的支持。深层;语义理解、逻辑推!理决策、自主学“习进化等!认知智?能的关键技术,都是当下的研究重点。语音:合成技术、语音识…◁☆;别技术○•▪、手写识别“技术、自然…•◁!语言。处理技术、语音测评-□▽▲、技术、声纹识别“技术,这些!技术都?展现出了!讯!飞的超■▪▷●”强?实力。

  科大讯飞一直将“顶天立地”作为,企业的核。心使命。“顶天”=○,即技术顶,天◆○▲••,强调•=▷▼…;技术对A■▪▷▪▼▲?I发展的;的!重、要性。科大讯飞…☆:长;期对科研保;持着高投入,据其2018年:财报显示,2018年公司新增相关研发费▪▲◇。用4○△-.52亿元,相关研发费、用总、额达12.63亿元•-,较上年!同期增“长55.82%。科研投入可谓相?当…○◁…!之大△•◆▪☆○,难怪其技术可,以一直保持行业领先了。

  科大讯飞还是目前我国唯一以语音技术为产业化方向的“国家863计;划成果产业化基地”、“国家规划布局内重点软件企业☆•-▽”、“国家?高技术“产业化示范工程☆▼▲▷●◆”, 曾两;次荣获“国家科技:进步奖▽”及中国信息产业自主创新荣誉○●▷☆▲“信息产业重大技术发明奖”。科技部明确依托科大讯飞建设了认知智能国家重点实验室,这是我国在人工智能高级阶段——认知智能领域的第一个国家级重点实验室。

  领先的技术以及对整个人工智能生!态产。业的全面”把控★▽=▷▼•?上,科大讯?飞向、人们展现出了它的长◇--◁…?远眼光。其构建的国内首个以智能语音和人机交互为核心的人工智能开放平台——讯飞开放平台,并基于该平台相继推出:讯飞输“入法、讯飞听见等示范性应用□△□◇◁,推动与广大合作伙伴携手构建以讯飞为中心的人工智能产业生态。其在:智能语音和人工;智能核心研究和产业化方面的突出“成绩,也得到了;社会各界和国内外的一致认可▼☆,被称为“中国人工智能国★-◁。家队”。

  对技术的•-“不断追求,对科研的、不断精进,对用户的◁▷•”细微关注,是每一个希望大力发展▼■,AI的企业”都应该学习的,如今”的科大讯飞▷-▪◇△, 仍在以高速不•=。断迈进和。发展=●★,我们希望在未来,能够看到科大讯飞一个又一个技术上的突破▼-=,引领中“国A”I技术继□▪。续前行。

  电子邮箱:违法和不良信息举报电话○▲=…◆!

  中文最●■◁•◇-“佳,哈工大讯”飞联合发布全词?覆盖、中文BE,RT模型,近日□▼,哈工大“讯飞联合实验室发布了基于全词覆盖的中“文; BER“T 预训练模,型,该模型在多个中文数据集上◁…■▽○…,取得了当”前中文预训练模型的最佳水平,部分效果甚至超过了原!版 BE。RT▼★★--、ER○;NI★▲•●、E等中“文预训◆-▷,练模型。