Hacia una IA más comprensible: el impacto de los hallazgos de Anthropic en los grandes modelos lingüísticos
Los hallazgos muestran que Claude utiliza componentes no ligados a idiomas específicos al formular respuestas, y luego selecciona el idioma para responder. En cálculos, adoptó estrategias internas no presentes en sus datos de entrenamiento, y en poesía mostró planificación anticipada, desafiando suposiciones previas.
Anthropic busca que estos descubrimientos ayuden a mejorar la confiabilidad de las IA y sirvan en áreas como la medicina y la genómica. Reconocen limitaciones en su enfoque actual, pues entender circuitos complejos aún requiere mucho esfuerzo humano.
Paralelamente, OpenAI y Google también enfrentan desafíos con las "cajas negras". OpenAI exploró patrones neuronales en IA, mientras Google observó aprendizajes inesperados en sus modelos, destacando las complejidades en la comprensión de estas tecnologías emergentes.
Comentarios
Publicar un comentario