Las herramientas que marcan el texto generado por IA pueden ser útiles, pero la precaución es fundamental.
A medida que los estudiantes recurren cada vez más a herramientas de IA para ayudar con sus deberes, se ha pedido a profesores y profesores que asuman un nuevo papel: detectives con la misión de garantizar la integridad académica. ¿Fue un estudiante o ChatGPT quien escribió el ensayo? Los detectores de IA han salido al rescate, ayudando a los educadores a identificar el texto generado por IA en las entregas de los estudiantes. Sin embargo, estas herramientas están lejos de ser perfectas.
Como científico que ha estudiado extensamente los detectores de ensayos generados por IA desde que se desarrollaron, debo reiterar: ningún detector de IA puede lograr una precisión perfecta. Diferentes detectores pueden clasificar erróneamente los ensayos—ya sea señalando erróneamente la escritura humana auténtica como generada por IA o fallando rotundamente en captar el contenido generado por IA—lo que pone de manifiesto la necesidad de un uso y un escrutinio cuidadosos.
A partir de la investigación que mis colegas y yo realizamos a principios de este año, aquí tienes algunos consejos sobre cómo los profesores y profesores pueden utilizar los detectores de IA de forma responsable.
Lee la etiqueta. Ningún detector de IA es infalible. Al usar una herramienta específica, ten en cuenta la precisión de detección que reporta. Por ejemplo, OpenAI afirmó que su propio detector identificaba correctamente el texto generado por IA solo el 26% de las veces y marcaba erróneamente el texto escrito por humanos como generado por IA el 9% de las veces; apagaron la herramienta seis meses después.
La longitud del texto importa. Los textos más largos generalmente ofrecen resultados más fiables con detectores de IA. En otras palabras, determinar si una sola palabra o una frase corta fue generada por IA es prácticamente imposible. Nuestro estudio sugirió que una longitud de texto de 50 palabras es un requisito mínimo para una detección fiable.
Los detectores de IA no señalarán de forma fiable contenido co-creado por humanos e IA. La definición y detección del texto generado por IA se vuelve ambigua cuando humanos e IA colaboran. Es importante establecer directrices claras para los estudiantes sobre cuánto contenido generado por IA se permite en cada tarea y por qué deben declarar cómo usaron la IA en su contribución.
Ten en cuenta: los detectores podrían estar sesgados. Los detectores de IA, probablemente por la forma en que están entrenados, a veces pueden mostrar sesgos contra ciertos grupos demográficos sin patrones claramente predecibles. Por lo tanto, desaconsejo confiar únicamente en los resultados de los detectores de IA para tomar decisiones de alto riesgo.
Utiliza más de una herramienta para mejorar la consistencia de los resultados. Diferentes detectores de IA pueden dar resultados variables para el mismo texto. Utilizar múltiples detectores y cruzar sus resultados puede proporcionar una evaluación más completa.
No te bases únicamente en detectores basados en texto. Considera fuentes adicionales de información, como datos de pulsaciones o grabaciones de vídeo del proceso de escritura, junto con las salidas de los detectores para tomar decisiones más informadas.
La tecnología de IA seguirá evolucionando y, inevitablemente, los estudiantes incorporarán herramientas de IA en sus estudios. Mis colegas y yo disfrutamos trabajando en TeachAI, y esperamos tener más oportunidades para ayudar a los educadores mientras apoyan el uso de tecnología en evolución por parte de sus estudiantes para tener éxito en la escuela y en la vida.
Jiangang es director de investigación y se especializa en la evaluación de habilidades complejas como la resolución colaborativa de problemas, la creatividad, la curiosidad y la alfabetización digital.