¿Cómo mido si mi verificador de IA sobre-afirma ante evidencia irrelevante?
Puedes medir si tu verificador de IA sobre-afirma ante evidencia irrelevante utilizando eleata-verify, que detecta over-assertion cuando un verificador afirma Soportado/Refutado sobre evidencia irrelevante. Eleata-verify te proporciona un certificado con una cota de riesgo conservadora calculada con Clopper-Pearson exacta.
Sobre eleata-verify · CLI MIT gratis con un cupo de verificaciones por mes.