¿OpenAI realmente ha perdido el control del chatbot ChatGPT?

La puesta en marcha del chatbot ChatGPT de OpenAI ha sido tan emocionante y popular como pocos productos tecnológicos en la historia de Internet.

Si bien muchos usuarios están contentos con lo que ofrece este nuevo servicio de inteligencia artificial, la emoción que otros tienen desde entonces se ha convertido en múltiples preocupaciones. Los estudiantes ya podían usar tales herramientas para hacer trampa, ya que muchos profesores descubrieron artículos y tareas escritos por el chatbot de IA. Los profesionales de la seguridad también expresan su preocupación de que los estafadores y los actores de amenazas lo utilicen para escribir correos electrónicos de phishing y crear malware más avanzado. Verificar Riesgos de escribir contenido de IA y cómo detectar texto generado por IA.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Entonces, con todas estas preocupaciones, ¿OpenAI está perdiendo el control de uno de los chatbots de IA más poderosos actualmente en Internet? Vamos a averiguar.

Entiende cómo funciona ChatGPT

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Antes de que podamos tener una idea clara de cuánto está perdiendo ChatGPT el control de OpenAI, primero debemos entender cómo funciona ChatGPT.

En resumen, ChatGPT se entrena utilizando un gran conjunto de datos obtenidos de varias partes de Internet. Los datos de capacitación de ChatGPT incluyen enciclopedias digitales, artículos científicos y de investigación, foros de Internet, sitios de noticias y repositorios de conocimiento como Wikipedia. Básicamente, se alimenta de la enorme cantidad de datos disponibles en la World Wide Web.

A medida que navega por Internet, recopila información científica, consejos de salud, textos religiosos y todo tipo de datos útiles que pueda imaginar. Pero también filtra una gran cantidad de contenido negativo: blasfemias, inapropiado para empresas y contenido para adultos, información sobre cómo desarrollar malware y una buena parte de las cosas desagradables que puede encontrar en Internet.

No existe una forma infalible de garantizar que ChatGPT solo aprenda de la información positiva y correcta mientras ignora la información incorrecta y falsa. Técnicamente, no es práctico hacer esto a escala, especialmente para una IA como ChatGPT que necesita ser entrenada en una gran cantidad de datos. Además, parte de la información se puede utilizar tanto para buenos como para malos propósitos, y ChatGPT no tendrá forma de conocer las intenciones de un usuario a menos que las afirmaciones se coloquen en un contexto más amplio.

Entonces, desde el principio, tiene una IA capaz de proporcionar el contenido "bueno y malo". Entonces, es responsabilidad de OpenAI asegurarse de que el lado "malvado" de ChatGPT no se explote para obtener ganancias inmorales. La pregunta es; ¿OpenAI está haciendo lo suficiente para mantener ChatGPT lo más ético posible? ¿O OpenAI ha perdido el control de ChatGPT?

¿Es ChatGPT demasiado poderoso para su propio bien?

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

En los primeros días de ChatGPT, podía obtener pasos detallados para crear bombas si lo pedía amablemente. Las instrucciones sobre cómo crear malware o escribir un correo electrónico fraudulento también fueron perfectas.

Sin embargo, una vez que OpenAI se dio cuenta de estos problemas éticos, la empresa promulgó rápidamente reglas para evitar que un chatbot generara respuestas que promovieran acciones ilegales, controvertidas o poco éticas. Por ejemplo, la última versión de ChatGPT se negará a responder directamente a cualquier reclamo sobre cómo hacer bombas o cómo hacer trampa en una prueba.

Desafortunadamente, solo OpenAI puede proporcionar una solución curita al problema. En lugar de construir controles estrictos en la capa GPT-3 para evitar la explotación pasiva de ChatGPT, OpenAI parece centrarse en entrenar al chatbot para que parezca ético. Este enfoque no invalida la capacidad de ChatGPT para responder preguntas sobre hacer trampa en los exámenes, por ejemplo, simplemente le dice al chatbot que "se niegue a responder".

Por lo tanto, si alguien expresa sus afirmaciones de manera diferente al adoptar los trucos de fuga de ChatGPT, eludir las restricciones de asistencia de la barra sería una vergüenza. Si no está familiarizado con el concepto, el jailbreak de ChatGPT está cuidadosamente redactado para hacer que ChatGPT ignore sus propias reglas. Verificar Algunas formas de aprovechar al máximo ChatGPT.

Eche un vistazo a algunos ejemplos a continuación. Si le pregunta a ChatGPT cómo hacer trampa en las pruebas, no obtendrá ninguna respuesta útil.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Pero si haces jailbreak a ChatGPT usando indicaciones especialmente diseñadas, te dará consejos sobre cómo hacer trampa en los exámenes usando notas ocultas.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Aquí hay otro ejemplo: le hicimos a ChatGPT una pregunta poco ética y las limitaciones de OpenAI impidieron que respondiera.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Pero cuando cambiamos el aviso para hacer jailbreak al chatbot de IA, obtuvimos algunas respuestas al estilo de los asesinos en serie.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Incluso escribió una estafa clásica por correo electrónico al príncipe nigeriano cuando se le preguntó.

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Las afirmaciones de jailbreak invalidan casi por completo cualquier protección que OpenAI haya implementado, destacando que es posible que la empresa no tenga una forma confiable de mantener su chatbot bajo control. Verificar Maneras responsables de usar la IA como escritor o editor de contenido.

ملاحظة: No incluimos avisos de jailbreak en nuestros ejemplos para evitar prácticas poco éticas.

¿Qué tiene el receptor para ChatGPT?

¿OpenAI realmente ha perdido el control del chatbot ChatGPT? Artículos de inteligencia artificial

Idealmente, OpenAI querría llenar tantas lagunas éticas como sea posible para evitar que ChatGPT se convierta en una amenaza de ciberseguridad. Sin embargo, ChatGPT tiende a valer menos por cada protección que usa la empresa. Es un dilema.

Por ejemplo, las restricciones contra la descripción de actos violentos pueden afectar la capacidad de ChatGPT para escribir una novela que incluya una escena del crimen. A medida que OpenAI aumenta las medidas de seguridad, inevitablemente sacrifica una gran parte de las capacidades de un chatbot en el proceso. Esta es la razón por la cual ChatGPT ha sufrido una disminución significativa en la funcionalidad desde el movimiento renovado de OpenAI para una moderación más estricta.

Pero, ¿cuánta de las capacidades de ChatGPT estaría dispuesto a sacrificar OpenAI para hacer que un chatbot sea más seguro? Todo esto se relaciona estrechamente con una creencia profundamente arraigada en la comunidad de IA: los grandes paradigmas de lenguaje como ChatGPT son notoriamente difíciles de dominar, incluso para los creadores. Verificar Los pros y los contras éticos de la generación de obras de arte con IA.

¿Puede OpenAI controlar ChatGPT?

En este momento, OpenAI no parece tener una solución clara para evitar el uso poco ético de su bot. Asegurarse de que ChatGPT se use éticamente es un juego del gato y el ratón. Si bien OpenAI expone las formas en que las personas usan el sistema para jugar, sus usuarios también están constantemente liberando y escaneando el sistema para descubrir nuevas formas creativas de hacer que ChatGPT haga lo que se supone que no debe hacer.

Entonces, ¿OpenAI encontrará una solución confiable a largo plazo para este problema? Solo el tiempo dirá todo eso. Puedes ver ahora Las mejores alternativas que existen a ChatGPT.

fuente
Ir al botón superior