{"id":16976,"date":"2024-08-23T10:43:07","date_gmt":"2024-08-23T08:43:07","guid":{"rendered":"https:\/\/bitacoraenlared.com\/internet\/?p=16976"},"modified":"2024-08-19T19:44:41","modified_gmt":"2024-08-19T17:44:41","slug":"chatgpt-y-el-humor-puede-la-ia-imitar-a-la-comedia-humana","status":"publish","type":"post","link":"https:\/\/bitacoraenlared.com\/internet\/chatgpt-y-el-humor-puede-la-ia-imitar-a-la-comedia-humana\/","title":{"rendered":"ChatGPT y el humor: \u00bfpuede la IA imitar a la comedia humana?"},"content":{"rendered":"<p>Los modelos de\u00a0<a href=\"https:\/\/hipertextual.com\/2024\/04\/empresas-de-ia-se-unen-contra-las-imagenes-de-abuso-sexual-infantil\">inteligencia artificial generativa<\/a>\u00a0ahora ocupan el centro de la escena. En tal contexto, se habla mucho acerca de los desarrollos m\u00e1s reconocidos \u2014entre ellos los de OpenAI y Google\u2014 y de otros emergentes. Ahora bien, los\u00a0<strong>v\u00ednculos entre ChatGPT y el humor\u00a0<\/strong>no se abordaron extensamente. Hasta ahora.<\/p>\n<p>Investigadores de la Universidad del Sur de California (USC), en Estados Unidos, decidieron\u00a0<strong>examinar si el modelo de IA generativa m\u00e1s famoso es capaz de hacernos re\u00edr<\/strong>. Las conclusiones del estudio sorprenden. Los cient\u00edficos encontraron que, en ciertos contextos, aquella entidad sint\u00e9tica es \u201ctanto o m\u00e1s graciosa que los humanos\u201d.<\/p>\n<p>\u201cEn nuestro estudio sobre ChatGPT y el humor, los participantes humanos calificaron bromas humanas y otras producidas por la IA, sin ser conscientes de su fuente\u201d, explican los investigadores. \u201c<strong>Los chistes del modelo de\u00a0<a href=\"https:\/\/hipertextual.com\/2024\/07\/nuevo-algoritmo-openai-ias-mas-faciles-de-entender\">OpenAI<\/a>\u00a0fueron calificados como igual o m\u00e1s divertidos que los producidos por humanos<\/strong>\u201d, aseguran.<\/p>\n<h2 id=\"h-chatgpt-y-el-humor-como-se-realizo-el-estudio\" class=\"wp-block-heading\">ChatGPT y el humor: \u00bfc\u00f3mo se realiz\u00f3 el estudio?<\/h2>\n<p>Si bien ya exist\u00edan estudios que examinaron las\u00a0<strong>capacidades de los modelos de IA para generar textos c\u00f3micos<\/strong>, los investigadores de la UCS, Drew Gorenz y Norbert Schwarz, decidieron ir m\u00e1s a fondo. Para ello, compararon las producciones del\u00a0<a href=\"https:\/\/hipertextual.com\/2024\/07\/chatgpt-vs-gemini-analisis-comparativa\">chatbot de OpenAI<\/a>\u00a0con la gracia de humanos, incluyendo la de escritores de revistas de humor.<\/p>\n<p>Los cient\u00edficos realizaron dos pruebas. En la primera,\u00a0<strong>solicitaron a un grupo de personas adultas que generen textos c\u00f3micos<\/strong>. Para ello, pidieron que se usen acr\u00f3nimos y respondan preguntas, que sirvieron como disparadores para bromas. Por ejemplo, \u201c\u00bfqu\u00e9 logro extraordinario probablemente no incluir\u00edas en tu curr\u00edculo laboral?\u201d. En esta revisi\u00f3n sobre ChatGPT y el humor, tambi\u00e9n invitaron a los participantes a elaborar una opini\u00f3n sincera sobre c\u00f3mo canta un amigo, que por cierto lo hace con muchas desafinaciones. \u201cPara ser honesto, o\u00edrte cantar fue como\u2026\u201d, es la frase con la que deb\u00edan comenzar el veredicto, siempre con un \u00e1nimo de humorismo.<\/p>\n<p>Luego, pidieron a ChatGPT \u2014en su versi\u00f3n 3.5\u2014 que realice esas mismas tareas. Finalmente, otros participantes evaluaron los resultados, otorgando puntajes seg\u00fan la gracia de las frases generadas tanto por los humanos como por el modelo de IA y sin conocer las fuentes en cada caso. La conclusi\u00f3n:\u00a0<strong>las bromas sint\u00e9ticas resultaron m\u00e1s c\u00f3micas<\/strong>. Casi el 70 % las prefiri\u00f3, frente al 26,5 % que eligi\u00f3 los chistes humanos. Cerca del 4 % consider\u00f3 igual de graciosos a los\u00a0<em>contendientes<\/em>\u00a0en esta batalla humor\u00edstica.<\/p>\n<h2 id=\"h-la-segunda-prueba-escribir-titulares-para-una-revista-comica\" class=\"wp-block-heading\">La segunda prueba: escribir titulares para una revista c\u00f3mica<\/h2>\n<p>La compatibilidad entre ChatGPT y el humor se confirm\u00f3, en el estudio de la USC, con un segundo experimento. Para el mismo, los investigadores\u00a0<strong>pidieron tanto a humamos como al modelo de IA que escriban titulares con el estilo de\u00a0<em><a href=\"https:\/\/www.theonion.com\/\" target=\"_blank\" rel=\"noreferrer noopener\">The Onion<\/a><\/em><\/strong>, una publicaci\u00f3n humor\u00edstica de Estados Unidos reconocida por su tono sat\u00edrico.<\/p>\n<p>En este caso, los resultados fueron juzgados por estudiantes de psicolog\u00eda y no hubo grandes ventajas. Cerca del 49 % consider\u00f3 m\u00e1s graciosos a los t\u00edtulos originales de\u00a0<em>The Onion<\/em>. Y el 37 % opin\u00f3 que los generados por ChatGPT eran m\u00e1s c\u00f3micos.<\/p>\n<p>\u201cQue\u00a0<strong>ChatGPT pueda generar humor<\/strong>\u00a0escrito con una calidad que supera las capacidades de los aficionados, e iguala las de algunos escritores profesionales de comedia, tiene repercusiones importantes para los amantes del g\u00e9nero. Tambi\u00e9n para los trabajadores de la industria del entretenimiento\u201d, dijeron los investigadores. \u201cPara los escritores profesionales de comedia, nuestros resultados sugieren que los modelos de lenguaje masivo (LLM) ser\u00e1n una seria amenaza para su empleo\u201d, a\u00f1adieron.<\/p>\n<h2 id=\"h-entrevista-exclusiva-al-autor-del-estudio-es-importante-evaluar-las-habilidades-de-chatgpt-para-bromear-dice-drew-gorenz\" class=\"wp-block-heading\">Entrevista exclusiva al autor del estudio: \u201cEs importante evaluar las habilidades de ChatGPT para bromear\u201d, dice Drew Gorenz<\/h2>\n<p><strong>\u00bfC\u00f3mo surgi\u00f3 la idea de estudiar los v\u00ednculos entre ChatGPT y el humor?<\/strong><\/p>\n<p>Recuerdo que estaba escuchando un episodio de\u00a0<em>podcast<\/em>\u00a0de Ezra Klein y que \u00e9l estaba hablando con un invitado sobre IA. Ezra opinaba que la raz\u00f3n por la que los LLM no hab\u00edan alterado la industria del periodismo tanto como la gente predijo, era por su tendencia a alucinar. En una industria donde la precisi\u00f3n es muy importante, esta es una enorme barrera para utilizarlos.<\/p>\n<p>Entonces pens\u00e9 qu\u00e9 pasa con el entretenimiento? En ese \u00e1mbito, la gente se preocupa menos por cuestiones de exactitud. En cambio, est\u00e1n m\u00e1s interesados \u200b\u200ben la pregunta: \u00bfes esto entretenido? Y en la comedia, \u00bfes esto gracioso? Si los modelos de IA son lo suficientemente divertidos, puede que a la mayor\u00eda de las personas no les importe si inventan cosas. Fue entonces cuando decid\u00ed que quer\u00eda saber qu\u00e9 tan graciosos son.<\/p>\n<p><strong>\u00bfPor qu\u00e9 han utilizado la versi\u00f3n ChatGPT 3.5 para este estudio, considerando las ventajas que ahora ofrece GPT 4o?<\/strong><\/p>\n<p>Ocurre que realizamos nuestro estudio el a\u00f1o pasado, antes del\u00a0<a href=\"https:\/\/hipertextual.com\/2024\/05\/como-probar-gpt-4o-la-nueva-inteligencia-artificial-de-openai\">lanzamiento de GPT-4o<\/a>. La versi\u00f3n anterior de pago de GPT-4 ya estaba disponible. Pero primero quer\u00eda ver qu\u00e9 tan buena era la versi\u00f3n gratuita (GPT 3.5), ya que es m\u00e1s accesible para todos.<\/p>\n<p><strong>En vuestro examen sobre ChatGPT y el humor, \u00bfhan realizado pruebas similares con otros chatbots, tal vez con Gemini o\u00a0<a href=\"https:\/\/hipertextual.com\/2024\/06\/asi-es-claude-3-5-sonnet-la-nueva-ia-que-derrota-a-gpt-4o-y-gemini\">Claude de Anthropic<\/a>?<\/strong><\/p>\n<p>Nos hemos enfocado en el modelo de OpenAI. S\u00ed he jugado con los otros chatbots. Me gusta mucho Claude 3.5 en este momento. Todav\u00eda tengo que probar experimentalmente estos modelos entre s\u00ed y evaluar los comentarios de la gente, pero me gustar\u00eda hacerlo en el futuro.<\/p>\n<p><strong>La metodolog\u00eda del estudio es interesante. \u00bfC\u00f3mo tuvieron la idea de pedirle al chatbot que redacte titulares con el estilo de\u00a0<em>The Onion<\/em>?<\/strong><\/p>\n<p>En el primer estudio, probamos qu\u00e9 tan divertido era ChatGPT-3.5 en comparaci\u00f3n con la gente \u201cnormal\u201d. En ese caso, super\u00f3 a los humanos en varias pruebas de rendimiento humor\u00edstico. A continuaci\u00f3n, quer\u00eda subir el list\u00f3n y encontrar una manera de probar un LLM con escritores de comedia profesionales.\u00a0<em>The Onion\u00a0<\/em>es una organizaci\u00f3n de noticias sat\u00edricas de gran \u00e9xito en Estados Unidos y, personalmente, una de mis favoritas.<\/p>\n<p>En una \u00e9poca en la que la comedia m\u00e1s exitosa se basa en im\u00e1genes, audio o video, esa publicaci\u00f3n todav\u00eda produce algunos de los mejores chistes de solo texto en forma de titulares de noticias sat\u00edricos. Dado que ChatGPT solo pod\u00eda producir chistes de texto,\u00a0<em>The Onion<\/em>\u00a0se convirti\u00f3 en una gran fuente de comparaci\u00f3n.<\/p>\n<p><strong>Tras la lectura de vuestro estudio, nosotros mismos revisamos la relaci\u00f3n entre ChatGPT y el humor. En nuestras pruebas \u2014pedimos al chatbot que cuente chistes\u2014 las bromas son aburridas, demasiado infantiles. \u00bfEsto puede deberse a que los desarrolladores, OpenAI en este caso, prefieren no meterse en problemas con chistes un poco m\u00e1s \u201cpicantes\u201d?<\/strong><\/p>\n<p>Bueno, ten en cuenta esto. Si bien muchos buenos chistes pueden ser considerados ofensivos por algunos, e inofensivos por otros, no creo que los chistes tengan que ser ofensivos o \u201cpicantes\u201d para ser divertidos. Hay muchos c\u00f3mics \u201c<em>clean<\/em>\u201d que han tenido un gran \u00e9xito profesional. Dicho esto, hay muchas razones por las que es posible que uno no aprecie los chistes de LLM fuera de las barreras establecidas para moderar su contenido.<\/p>\n<p><strong>\u00bfCu\u00e1les son esas variables?<\/strong><\/p>\n<p>Por un lado, al estudiar a ChatGPT y el humor, aparece lo siguiente. La escritura es solo un componente de la producci\u00f3n de la comedia. El otro componente es la entrega o el soporte. La gente tiende a calificar los chistes que solo contienen texto como menos divertidos que aquellos que involucran im\u00e1genes y texto o elementos audiovisuales. Dado que estos modelos no crean humor basado en im\u00e1genes, audio o video, solo deber\u00edamos compararlo con otras comedias basadas en texto, no con videos o memes, por ejemplo.<\/p>\n<p>Dicho esto, los LLM incorporan cada vez m\u00e1s im\u00e1genes, audio y v\u00eddeo a medida que surgen nuevos modelos con mayor potencia inform\u00e1tica y datos de formaci\u00f3n. Y se podr\u00edan combinar las capacidades de redacci\u00f3n de humor de un modelo de IA con las capacidades de producci\u00f3n de im\u00e1genes, audio o v\u00eddeo de otro para contar los chistes.<\/p>\n<p><strong>Anteriormente mencionabas un segundo factor para analizar los v\u00ednculos entre ChatGPT y el humor. Tambi\u00e9n para comprender por qu\u00e9 sus chistes en ocasiones resultan demasiado livianos\u2026<\/strong><\/p>\n<p>Claro. La otra parte clave es la incitaci\u00f3n. Al igual que la inteligencia artificial, la mayor\u00eda de las personas, incluidos los comediantes, no actuar\u00edan bien si se les pidiera en el acto que \u201cdigan algo gracioso\u201d. Mucha comedia es contextual. Cuando evaluamos las habilidades de producci\u00f3n de humor de las personas, les dimos un contexto y limitaciones en nuestras indicaciones. Es decir, \u00abun logro notable que probablemente no incluir\u00edas en tu curr\u00edculo\u201d), as\u00ed como ejemplos de buenas respuestas.<\/p>\n<p>Advertimos que los LLM pueden producir chistes de menor calidad en respuesta a indicaciones m\u00e1s ambiguas que carecen de ejemplos, limitaciones o contexto social. Por ejemplo, otro grupo de investigadores (Jentzsch y Kersting, 2023) le dieron a ChatGPT este mensaje: \u00ab\u00bfPuedes contarme un chiste, por favor?\u00bb, solamente con variaciones sutiles en la redacci\u00f3n. Por ejemplo, \u201cme encantar\u00eda escuchar un chiste\u201d, repiti\u00e9ndolo miles de veces. Como era de esperar, el chatbot devolvi\u00f3 muchas bromas redundantes de mala calidad en respuesta a estas indicaciones gen\u00e9ricas. La conclusi\u00f3n fue que ChatGPT \u00abes divertido, pero no tanto\u00bb.<\/p>\n<p><strong>\u00bfPor qu\u00e9 es importante evaluar la capacidad de humor de estos sistemas sint\u00e9ticos? \u00bfCrees que es relevante, para los LLM, alcanzar la capacidad de imitar a los humanos, tambi\u00e9n en ese aspecto?<\/strong><\/p>\n<p>Muchos investigadores han documentado el conocimiento y las capacidades de razonamiento anal\u00edtico de los sistemas de IA emergentes. Pocos han estudiado sus habilidades m\u00e1s creativas. Pensamos que era igualmente importante documentar su posici\u00f3n creativa en la producci\u00f3n de humor. Comprender sus habilidades creativas nos ayuda a prepararnos para futuras disrupciones de la industria. Tambi\u00e9n nos ense\u00f1a sobre la producci\u00f3n de humor.<\/p>\n<p>Dado que los LLM no pueden sentir emociones, no experimentan la sensaci\u00f3n de apreciar un buen chiste. Sin embargo, ellos mismos pueden hacer un buen chiste. Esto nos dice que las emociones no son una parte necesaria para producir una buena comedia. Otros componentes, como el reconocimiento de patrones, pueden ser m\u00e1s importantes.<\/p>\n<p><strong>A fin de cuentas, \u00bfen qu\u00e9 se diferencia ChatGPT a la hora bromear, en comparaci\u00f3n con la b\u00fasqueda de chistes en Google? M\u00e1s all\u00e1 de las diferencias evidentes, \u00bfqu\u00e9 cambia?<\/strong><\/p>\n<p>Bueno, las b\u00fasquedas web arrojan contenido que ya ha sido creado. Si buscamos algo que no se haya creado antes, no lo encontraremos en Google. En cambio, los LLM crean contenido nuevo. Debido a esto, son considerablemente m\u00e1s flexibles para las demandas espec\u00edficas que usted podr\u00eda presentarles. Por ejemplo, puede responder qu\u00e9 le dir\u00eda Shrek al expresidente Barack Obama si se encontraran en una cita para tomar un helado.<\/p>\n<p>Titulado\u00a0<em><strong>Cu\u00e1n gracioso es ChatGPT<\/strong><\/em>, el estudio fue publicado en la revista\u00a0<em>Plos One<\/em>\u00a0y puede consultarse \u2014completo, en ingl\u00e9s\u2014 en\u00a0<a href=\"https:\/\/journals.plos.org\/plosone\/article?id=10.1371\/journal.pone.0305364#sec013\">este enlace<\/a>.<\/p>\n<p><a class=\"url fn n\" href=\"https:\/\/hipertextual.com\/author\/urielbederman\">Uriel Bederman<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los modelos de\u00a0inteligencia artificial generativa\u00a0ahora ocupan el centro de la escena. En tal contexto, se habla mucho acerca de los desarrollos m\u00e1s reconocidos \u2014entre ellos los de OpenAI y Google\u2014 y de otros emergentes. Ahora bien, los\u00a0v\u00ednculos entre ChatGPT y el humor\u00a0no se abordaron extensamente. Hasta ahora. Investigadores de la<span class=\"more-link\"><a href=\"https:\/\/bitacoraenlared.com\/internet\/chatgpt-y-el-humor-puede-la-ia-imitar-a-la-comedia-humana\/\">Seguir leyendo<\/a><\/span><\/p>\n","protected":false},"author":1,"featured_media":16977,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[9],"tags":[4,3],"class_list":["entry","author-admin","post-16976","post","type-post","status-publish","format-standard","has-post-thumbnail","category-tecnologia","tag-fuprisa","tag-jose-manuel-fuentes-prieto"],"nelio_content":{"autoShareEndMode":"never","automationSources":{"useCustomSentences":false,"customSentences":[]},"efiAlt":"","efiUrl":"","followers":[1],"highlights":[],"isAutoShareEnabled":true,"networkImageIds":[],"permalinkQueryArgs":[],"series":[],"suggestedReferences":[]},"jetpack_featured_media_url":"https:\/\/bitacoraenlared.com\/internet\/wp-content\/uploads\/sites\/2\/2024\/08\/chatgt-y-el-humor-1.jpg","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/posts\/16976","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/comments?post=16976"}],"version-history":[{"count":1,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/posts\/16976\/revisions"}],"predecessor-version":[{"id":16979,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/posts\/16976\/revisions\/16979"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/media\/16977"}],"wp:attachment":[{"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/media?parent=16976"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/categories?post=16976"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/bitacoraenlared.com\/internet\/wp-json\/wp\/v2\/tags?post=16976"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}