Skip to main content

Humanos sí le ganan en algo a ChatGPT: en contabilidad

Una investigación de la Universidad Brigham Young quiso medir las habilidades existentes entre humanos y la IA de ChatGPT en la resolución de problemas de contabilidad. Los estudiantes obtuvieron un promedio general de 76.7%, en comparación con el puntaje de ChatGPT de 47.4%. En un 11.3% de las preguntas, ChatGPT obtuvo una puntuación más alta que el promedio de los estudiantes, obteniendo un desempeño particularmente bueno en AIS y auditoría.

«Cuando esta tecnología salió por primera vez, todos estaban preocupados de que los estudiantes ahora pudieran usarla para hacer trampa», dijo el autor principal del estudio, David Wood, profesor de contabilidad de BYU. «Pero las oportunidades para hacer trampa siempre han existido. Entonces, para nosotros, estamos tratando de enfocarnos en lo que podemos hacer con esta tecnología ahora que no podíamos hacer antes para mejorar el proceso de enseñanza para los profesores y el proceso de aprendizaje para los estudiantes. Probarlo fue revelador».

Imagen utilizada con permiso del titular de los derechos de autor

327 coautores de 186 instituciones educativas en 14 países participaron en la investigación, contribuyendo con 25,181 preguntas de exámenes de contabilidad en el aula. También reclutaron estudiantes de pregrado de BYU (incluida la hija de Wood, Jessica) para alimentar otras 2,268 preguntas del banco de pruebas de libros de texto a ChatGPT. Las preguntas abarcaban los sistemas de información contable (SIA), la auditoría, la contabilidad financiera, la contabilidad administrativa y los impuestos, y variaban en dificultad y tipo (verdadero/falso, opción múltiple, respuesta corta, etc.).

Cuando se trataba del tipo de pregunta, ChatGPT tuvo mejores resultados en preguntas verdaderas/falsas (68.7% correctas) y preguntas de opción múltiple (59.5%), pero tuvo problemas con las preguntas de respuesta corta (entre 28.7% y 39.1%). En general, las preguntas de orden superior eran más difíciles de responder para ChatGPT. De hecho, a veces ChatGPT proporcionaría descripciones escritas autorizadas para respuestas incorrectas, o respondería la misma pregunta de diferentes maneras.

Los investigadores también descubrieron algunas otras tendencias fascinantes a través del estudio, que incluyen:

  • ChatGPT no siempre reconoce cuando está haciendo matemáticas y comete errores sin sentido, como sumar dos números en un problema de resta o dividir números incorrectamente.
  • ChatGPT a menudo proporciona explicaciones para sus respuestas, incluso si son incorrectas. Otras veces, las descripciones de ChatGPT son precisas, pero luego procederá a seleccionar la respuesta de opción múltiple incorrecta.
  • ChatGPT a veces inventa hechos. Por ejemplo, al proporcionar una referencia, genera una referencia de aspecto real que está completamente fabricada. La obra y a veces los autores ni siquiera existen.
Diego Bastarrica
Diego Bastarrica es periodista y docente de la Universidad Diego Portales de Chile. Especialista en redes sociales…
Los nuevos auriculares de Nothing eclipsan a Apple, Google y Amazon al incorporar ChatGPT
Nothing Ear

Nothing
La compañía de teléfonos inteligentes Nothing tiene dos nuevos juegos de auriculares inalámbricos que van tras los AirPods Pro de Apple en más de un sentido. El Nothing Ear (149 dólares) y el Nothing Ear (a) dólares) ofrecen cancelación de ruido, audio de alta resolución y una estrecha integración con los teléfonos de Nothing, pero también proporcionan acceso a ChatGPT, posiblemente el servicio de IA más popular del mundo.

Se trata de un asalto frontal a los tres principales asistentes de voz que actualmente dominan los smartphones: Siri, Google Assistant y Alexa. Estos asistentes son muy capaces cuando se trata de comandos de voz simples, como pausar la música o preguntar sobre el clima, pero no han seguido el ritmo de ChatGPT de Open AI, que ofrece tareas más sofisticadas y conversaciones por turnos.

Leer más
Apple finalmente tiene una forma de derrotar a ChatGPT
apple cambia navegacion web iphone navegaci  n

Yugandhar Bonde / Pexels
OpenAI debe tener cuidado porque Apple finalmente puede subirse al carro de la IA, y la noticia no es un buen augurio para ChatGPT. Según los informes, Apple está trabajando en un modelo de lenguaje grande (LLM) conocido como ReALM, que significa Resolución de referencia como modelado de lenguaje. Hecho para darle un impulso a Siri y ayudarlo a comprender el contexto, el modelo viene en cuatro variantes, y Apple afirma que incluso su modelo más pequeño funciona a un nivel similar al ChatGPT de OpenAI.

Esta tentadora información proviene de un documento de investigación de Apple, compartido por primera vez por Windows Central, y parece ser un primer vistazo a lo que Apple ha estado cocinando desde hace un tiempo. ReALM es el propio LLM de Apple que, según se informa, se creó para mejorar las capacidades de Siri; Estas mejoras incluyen una mayor capacidad para comprender el contexto de una conversación.

Leer más
Así será la versión extra gratuita de ChatGPT
¿Qué es ChatGPT? Cómo usar el chatbot del que todo el mundo habla.

Una versión aún más extra gratuita de ChatGPT está debutando desde este 1 de abril, ya que a partir de hoy en algunos mercados y extendiéndose gradualmente al resto del mundo, visitar chat.openai.com ya no te pedirá que inicies sesión, aunque aún puedes hacerlo si lo deseas. En su lugar, se le permitirá entablar una conversación con ChatGPT, que utilizará el mismo modelo que los usuarios registrados.

Por supuesto, esta versión será incluso más limitada que la edición gratis a la que se accede con registro, y tendrá algunas diferencias sustanciales:

Leer más