相似度论文再回顾
创始人
2024-03-06 13:53:57

Towards a Unified Multi-Dimensional Evaluator for Text Generation

多个维度出发评价生成文本的质量,如一致性、流畅度等等。

每个维度的伪标注样本数量为30K,作者构建的数据集:

we first design specific rules for several commonly evaluated dimensions to construct pseudo data, and then combine them to train the evaluator.

任务形式:summary和dialogue。

实验验证:对比model有BLEU、METHOR、ROUGE、Bertscore....

人工标注的数据:TO verfify the proposed evaluator is qualifited, we need to calculated correlations with human scores in each benchamark.

Train the evaluator for 1-3 epochs. _Supervised method.

BARTSCORE: Evaluating Generated Text as Text Generation

Conditional text generation: for example,machine translation, so the goal is to generate a hypothesis (h = h1, · · · , hm) based on a given source text (s = s1, · · · , sn)

require human judgments to train (i.e., supervised me

相关内容

热门资讯

华尔街、贸易商齐声警告:霍尔木... 就在美国和伊朗就停战问题胶着拉扯之际,全球石油库存正在以创纪录的速度下降。华尔街分析师和能源贸易商警...
景林最新美股持仓曝光 加仓英特... 格隆汇5月10日|景林资产向美国证券交易委员会提交的季度持仓13-F表显示,该机构在去年底持有259...
全民追“光”!热门股抱团飙涨 ...   当前A股最耀眼的板块就是“光”,光模块、光纤、光器件、光芯片等概念股均是“热门行业里的热门股”,...
普京:坚决制止篡改二战历史图谋 △俄罗斯总统普京(资料图)俄罗斯总统普京9日在莫斯科克里姆林宫表示,必须坚决制止任何篡改二战历史和美...
禁飞通告 | 5月17日,长春... 长春市人民政府关于在马拉松赛事期间对低空慢速小目标航空器实施临时管控的通告2026一汽红旗长春马拉松...