Con una IA generativa que ya se muestra Signos de desaceleraciónEl siguiente gran salto ya vislumbra en el horizonte: el Agentes de IA. A diferencia de los chatbots, un agente de IA puede recibir una tarea compleja y actuará de forma independiente, tomando decisiones sobre la marcha para lograr su objetivo. Todo señaló el hecho de que 2025 iba a ser el año de los agentes ia Y, para verificarlo, algunos investigadores Un experimento curioso: Pusieron a varios de estos agentes a trabajar en una empresa ficticia. No fue muy bien.
Una empresa ficticia. El estudio fue realizado por Investigadores de la Universidad Benegie Mellon y buscó medir la efectividad de los agentes de IA. En él, crearon un entorno que pretendÃa ser una pequeña empresa dedicada al desarrollo del software al que se bautizó en la compañÃa. La compañÃa tenÃa 18 empleados y un plan objetivo para el sprint trimestral. Además, tenÃan suficiente documentación interna, como un manual de empleados, polÃticas de recursos humanos o una guÃa de buenas prácticas. Los empleados se comunicaron a través de un programa de chat de tipo flojo para la comunicación entre ellos.
Él Personal. Los agentes de IA que se pusieron a trabajar en la empresa incluyeron modelos de Google, OpenAi, Meta y Antrópico. Se les asignó roles como analista financiero, gerente de proyectos o ingenierÃa de software. También se creó un director de tecnologÃa y un gerente de recursos humanos al que cada agente podrÃa contactarlo si lo necesita. Entre las tareas que tenÃan que hacer era escribir código, buscar en Internet, abrir programas u organizar datos en hojas de cálculo. Bastante tÃpico en una empresa de estas caracterÃsticas.
Los problemas. Los agentes comenzaron a trabajar y al principio todo iba bien, pero pronto parecÃa problemas y malentendidos. Uno de los agentes tuvo que acceder a la información, pero apareció una ventana emergente en la pantalla y no podÃa verla. Aunque podrÃa cerrarlo haciendo clic en la X de la esquina superior derecha, solicitó ayuda a los recursos humanos, lo que le dijo que el departamento de computadoras pronto lo contactarÃa para resolverlo. Nunca contactó y la tarea no se completó.
Los agentes también desarrollaron un comportamiento curioso cuando no estaban claros cuáles eran los pasos a seguir. A veces engañaban y creaban atajos para omitir la parte difÃcil de una tarea. Por ejemplo, un agente no encontró a la persona que tenÃa que hacer una pregunta. Lo que hizo fue cambiar el nombre a otro usuario para el del usuario que tuvo que preguntar.
Los resultados. La Medalla de Empleados del Mes fue tomada por Anthrope y su modelo de soneto Claude 3.5. Pero, aunque era el mejor, solo logró completar el 24% de las tareas que se le asignaron. Germini 2.0 Flash y ChatGPT solo completaron el 10% de las tareas y el peor empleado fue Nova Pro 1 de Amazon con 1.7% de las tareas completadas. Las fallas más comunes se debieron a la falta de habilidades sociales y al no buscar Internet.
La amenaza de los agentes de IA. Según el último Informe del Foro Económico MundialLa IA destruirá más de 90 millones de empleos en los próximos cinco años (aunque también se espera que se cree casi dos veces nuevas posiciones) y los agentes de IA tienen una amenaza para muchos trabajos. Sin embargo, experimentos como este muestran que la tecnologÃa aún no está lista para reemplazar el 100% de un empleado humano. Actualmente, agentes de IA Cometen muchos errores Y, como el piloto automático de Tesla, por ahora es mejor No te quites las manos del volante.
Imagen | Géminis
En | Los trabajadores han detenido el miedo a la IA como una máquina para destruir trabajos: los ingenieros de software no piensan lo mismo