首页文档 GLUE-X：基于分布外泛化的自然语言理解模型测试集

GLUE-X：基于分布外泛化的自然语言理解模型测试集

星宿海上的灯塔 2023-09-18 👁 32 版权申诉

GLUE-X：基于分布外泛化的自然语言理解模型测试集

先看看前几页

会员免费下载

提示：微信付费后，自动下载；手机下载，请勿设置弹窗拦截。

Pre-trained language models (PLMs) are known to improve the generalization perfor- mance of natural language understanding models by leveraging large amounts of data during the pre-training phase. However, the out-of-distribution (OOD) generalization problem remains a challenge in many NLP tasks, limiting the real-world deployment of these methods. This paper presents the first at- tempt at creating a unified benchmark named GLUE-X for evaluating OOD robustness in NLP models, highlighting the importance of OOD robustness and providing insights on how to measure the robustness of a model and how to improve it. The benchmark includes 15 publicly available datasets for OOD testing, and evaluations are conducted on 8 classic NLP tasks over 21 popularly used PLMs. Our findings confirm the need for improved OOD accuracy in NLP tasks, as significant perfor- mance degradation was observed in all settings compared to in-distribution (ID) accuracy.

展开剩余(...)

预读部分内容

预读下一页

微信支付10元后自动下载x

您已支付成功！

提示：请勿删除浏览器缓存。

GLUE-X：基于分布外泛化的自然语言理解模型测试集

微信扫码分享

0

0

分享

上一篇: CEO的ESG困境

下一篇: 通过后门水印保护基于大模型的向量表示服务的版权

还没有评论，赶紧来抢沙发吧！

商务展示企业内训

03-09

商务展示企业内训

给青年的十二封信

这本《给青年的十二封信》是朱光潜先生于20世纪20年代发表于《一般》杂志的文章合集，每一篇都是以“ 朋友 ”开头的书信体 …

2023-06-17

贺卡 (8)

2023-12-01

贺卡 (8)

主播线下签约协议

2023-12-01

主播线下签约协议

2022中国情侣分手报告

每逢情人佳节，除了你侬我侬与罗曼蒂克，以及—年一度的朋友圈秀恩爱睾比大赛，也会出现一些酸拧檬的声音：『秀恩爱，死得快』 …

2023-08-27

⽆价：洞悉⼤众⼼理玩转价格游戏

为什么免费的巧克力让我们疯狂？为什么百老汇剧场里价格越高的位置卖得越火？为什么100万美元带来的愉悦感，400万美元才能 …

2023-10-18

奔跑的查理

跑步，让我找到某些东西，也让我丢弃某些东西。这是一本记录世界著名长跑运动员查理·恩格成长经历的励志小说。查理·恩格的一生 …

2023-07-01

日本未来时：日本科幻与科幻日本

2023-11-14

日本未来时：日本科幻与科幻日本

靠谱：顶尖咨询师教你的⼯作基本功

2023-11-02

靠谱：顶尖咨询师教你的⼯作基本功

跨越ChatGPT大模型和AI2.0的未来演讲PPT

AI进入“大模型时代” GPT-3，PaLm，LaMDA，OPT，BLOOM，GPT-Neo，Megatron-Turi …

2023-04-07

普京国情咨文讲话全文

2023-09-24

普京国情咨文讲话全文

你其实不懂销售谈资课

销售其实没有那么艰难晦涩，本质上销售就是搞定人的学问！打开人的最重要环节就是与不同的人找到共同话题，完成情感铺垫，进而沟 …

2023-10-12

店长进化论

门店业绩指标难完成？公司标准难贯彻？店员管理费心神？ …… 本书针对店长在门店经营过程中面临的突出问题和困惑，从店长的素 …

2023-05-05

杜拉拉升职记全集

2023-11-15

杜拉拉升职记全集

极光拼多多监测数据全面解析电商新贵裂变先锋

截止2020年6月底，拼多多渗透率已达50.29%，位列全网第七，日活用户排名第六，在其一级行业（移动购物）和二级行业（ …

2023-02-28

ChatGPT浪潮下，看中国大语言模型产业发展

ChatGPT的横空出世拉开了大语言模型产业和生成式AI产业蓬勃发展的序幕。艾瑞将撰写AIGC系列报告，包括此篇《Ch …

2023-09-30

Egret：HTML5游戏开发指南

本书由浅⼊深，在讲解游戏开发基础的同时提供众多实战案例供读者学习。书中章节内容包含Egret基础概念及基础图形图像处理⽅ …

2023-05-31

智能电网：通过科技投资推动减碳

2023-12-14

智能电网：通过科技投资推动减碳

中医入门（高清版）

本书按中医的体系，分为理、法、方、药四个部分，依次叙述中医的基本理论、生理、病因、诊法、治疗法则，以及方剂和药物的组成运 …

2023-08-18

2022全球奢侈品力量

纳入百强榜的企业涵盖传统顶级奢侈品(ultra luxury)、高档奢侈品 (super premium)和仰慕型奢侈品 …

2023-09-07