¿Cómo mido si mi verificador de IA sobre-afirma ante evidencia irrelevante?

Puedes medir si tu verificador de IA sobre-afirma ante evidencia irrelevante utilizando eleata-verify, que detecta over-assertion cuando un verificador afirma Soportado/Refutado sobre evidencia irrelevante. Eleata-verify te proporciona un certificado con una cota de riesgo conservadora calculada con Clopper-Pearson exacta.

Sobre eleata-verify · CLI MIT gratis con un cupo de verificaciones por mes.

Más sobre eleata-verify