相似度论文再回顾
创始人
2024-03-06 13:53:57

Towards a Unified Multi-Dimensional Evaluator for Text Generation

多个维度出发评价生成文本的质量,如一致性、流畅度等等。

每个维度的伪标注样本数量为30K,作者构建的数据集:

we first design specific rules for several commonly evaluated dimensions to construct pseudo data, and then combine them to train the evaluator.

任务形式:summary和dialogue。

实验验证:对比model有BLEU、METHOR、ROUGE、Bertscore....

人工标注的数据:TO verfify the proposed evaluator is qualifited, we need to calculated correlations with human scores in each benchamark.

Train the evaluator for 1-3 epochs. _Supervised method.

BARTSCORE: Evaluating Generated Text as Text Generation

Conditional text generation: for example,machine translation, so the goal is to generate a hypothesis (h = h1, · · · , hm) based on a given source text (s = s1, · · · , sn)

require human judgments to train (i.e., supervised me

相关内容

热门资讯

智慧健康科技(01715.HK... 格隆汇3月31日丨智慧健康科技(01715.HK)公布年度业绩,2025年度,收益由截至2024年1...
联合利华160亿美元大动作,揭...   核心要点联合利华将食品业务与香料巨头味好美合并的计划,正值快消行业奋力维持市场地位之际。支撑大型...
中欧瑞丰灵活配置混合(LOF)... 核心财务数据:净利润增长显著 净资产与份额双降主要会计数据与财务指标2025年,中欧瑞丰灵活配置混合...
佰泽医疗(02609.HK)2... 格隆汇3月31日|佰泽医疗(02609.HK)公布年度业绩,2025年度,集团实现营收约人民币11....
振江股份(603507.SH)... 振江股份(603507.SH)披露2025年年度报告,报告期公司实现营收39.71亿元,同比增长0....