De vez en cuando, los grandes modelos de lenguaje se vuelven malvados, y nadie sabe bien por qué. El campo de la interpretabilidad mecanicista busca prevenir estos comportamientos inesperados.
Fm Masters En Vivo