21/01/07 06:31:32.05 x/T93yoF.net
小猫遊りょう(たかにゃし・りょう)
@jaguring1
言語理解のための代表的なベンチマーク「GLUE」と「SuperGLUE」で、成績ランキング(リーダーボード)が15時間ほど前に更新された。
マイクロソフトが作成したモデル「DeBERTa/TuringNLR v4」が最高性能をさらに更新。もちろん、人間のスコアを超えてる。SuperGLUEでは人間のスコアは3位、GLUEでは15位
URLリンク(twitter.com)
(deleted an unsolicited ad)