DeepEval:一个用于对语言模型应用进行评估和单元测试的框架。

分类

一个用于对语言模型应用进行评估和单元测试的框架。它提供了各种指标,可以测试语言模型应用生成的回复在相关性、一致性、无偏见性和无毒性等方面的表现。

https://www.cnblogs.com/skyfsm/p/8467613.html