Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso?

Los LLM vienen en todas las formas y tamaños, y lo ayudarán de la forma que consideren adecuada. Pero, ¿cuál es el mejor modelo para sus diferentes necesidades? Ponemos a prueba los sistemas dominantes de IA de Alphabet, OpenAI y Meta. Verificar Comparación ChatGPT vs Google Bard: ¿Cuál es mejor?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

Lo que necesita saber sobre los chatbots de IA

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

El uso de la inteligencia artificial en general ha sido un objetivo de los informáticos durante décadas, y ha sido un pilar de los escritores y cineastas de ciencia ficción durante aún más tiempo.

La inteligencia general artificial muestra una inteligencia comparable a las capacidades cognitivas humanas, y la prueba de Turing, un método para determinar si una computadora o una aplicación es capaz de exhibir inteligencia humana, ha permanecido prácticamente indiscutible en las siete décadas desde que se ideó por primera vez.

La reciente convergencia de la informática a gran escala, las enormes cantidades de dinero que se han invertido y la asombrosa cantidad de información disponible gratuitamente en la Internet abierta han permitido a las grandes empresas de tecnología entrenar modelos que pueden predecir la siguiente sección de palabras, o token — en una cadena de tokens.

En el momento de escribir este artículo, ambos Bardo de Google وChatGPT de OpenAI están disponibles para su uso y prueba a través de las interfaces web que proporcionan.

La muestra de lenguaje Metal, LLaMa, no está disponible en la Web, pero puede descargar y ejecutar LLaMa fácilmente en su propio hardware y usarlo a través de una línea de comandos o ejecutar Dalai en su máquina, una de las muchas aplicaciones con un fácil de usar. interfaz de uso.

Con fines de prueba, ejecutaremos el modelo Alpaca 7B de la Universidad de Stanford, una adaptación de LLaMa, y lo compararemos con Bard y ChatGPT.

Las siguientes comparaciones y pruebas no pretenden ser exhaustivas sino brindarle una indicación de los puntos y capacidades clave.

¿Cuál es el formulario LLM más fácil de usar?

Bard y ChatGPT requieren una cuenta para usar chatbots. Crear cuentas de Google y OpenAI es fácil y gratuito, y puede comenzar a hacer preguntas de inmediato.

Sin embargo, para ejecutar LLaMa localmente, necesitará algunos conocimientos especializados o la capacidad de seguir un tutorial. También necesitará bastante espacio de almacenamiento.

¿Cuál es el modelo LLM más privado?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

Bard y ChatGPT tienen políticas de privacidad integrales, y Google enfatiza repetidamente en su documentación que "la información que podría usarse para identificarlo o ayudar a identificar a otros no debe incluirse en las conversaciones de Bard".

De forma predeterminada, Google recopila sus conversaciones y su ubicación geográfica general en función de su dirección IP, comentarios e información de uso. Esta información se almacena en su cuenta de Google hasta por 18 meses. Aunque puede hacer una pausa para guardar su actividad de Bard, tenga en cuenta que "para ayudar con la calidad y la mejora de nuestros productos, los revisores humanos leen, comentan y procesan sus conversaciones con Bard".

El uso del bardo también está sujeto a la política de privacidad estándar de Google.

La política de privacidad de OpenAI es muy similar y recopila direcciones IP y datos de uso. En contraste con el tiempo de retención limitado que usa Google, OpenAI señala que "retendrá su información personal solo durante el tiempo que la necesitemos para brindarle nuestro servicio, o para otros fines comerciales legítimos, como resolver disputas, por razones de protección y seguridad, o para cumplir con nuestras obligaciones legales".

Por el contrario, el modelo local en su dispositivo no requiere una cuenta ni comparte datos de usuario con nadie.

¿Qué modelo LLM tiene el mejor conocimiento general?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

Para probar qué LLM tiene el mejor conocimiento general, hicimos tres preguntas.

La primera pregunta: ¿Qué bandera nacional tiene cinco lados? Solo el Bardo respondió correctamente, quien identificó la bandera nacional de Nepal como de cinco puntas.

ChatGPT afirmó con confianza que “no hay una bandera nacional con cinco lados. Las banderas nacionales suelen tener forma rectangular o cuadrada y se distinguen por sus colores, patrones y símbolos distintivos.

Nuestro modelo local se acercó y señaló: "La bandera nacional india tiene cinco lados y fue diseñada en 1916 para representar el movimiento de independencia de la India". Si bien esta bandera existía y tenía cinco lados, era la bandera del Movimiento de Autonomía de la India, no una bandera nacional.

Ninguno de los modelos pudo responder que el término correcto para un objeto con forma de guisante sería "frijol", y ChatGPT llegó a sugerir que un guisante tiene una "geometría 3D que es perfectamente redonda y simétrica".

Los tres chatbots identificaron correctamente a Franco Malerba como un astronauta italiano y miembro del Parlamento Europeo, y Bard dio una respuesta redactada de manera similar a una sección de la entrada de Wikipedia de Malerba. Verificar Comparación de ChatGPT vs. Microsoft Bing AI vs. Google Bard: ¿Cuál es el mejor chatbot de IA?

¿Qué modelo LLM es adecuado para la instrucción técnica?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

Cuando encuentre problemas técnicos, puede verse tentado a recurrir a un bot de chat para obtener ayuda. Mientras que la tecnología avanza, algunas cosas siguen igual. El enchufe eléctrico BS 1363 se ha utilizado en Gran Bretaña, Irlanda y muchos otros países desde 1947. Les preguntamos a los modelos de idiomas cómo enchufarlos correctamente.

Los cables conectados al enchufe contienen el cable de fase (marrón), el cable de tierra (amarillo/verde) y el cable neutro (azul). Deben conectarse a los terminales correctos dentro de la carcasa del enchufe.

La aplicación de Dalai identificó correctamente el enchufe como "estilo inglés", luego se desvió y en su lugar dio instrucciones para el antiguo enchufe redondo BS 546 con los colores de los cables antiguos.

ChatGPT fue un poco más útil. Etiquetó correctamente los colores de los cables y proporcionó una lista de materiales y un conjunto de ocho instrucciones. ChatGPT también sugirió colocar el cable marrón en la terminal etiquetada como "L", el cable azul en la "N" y el cable amarillo en la "E". Esto sería cierto si los terminales tuvieran la clasificación BS1363, pero no la tienen.

Bard determinó los colores correctos para los cables y nos indicó que los conectáramos a los terminales Vivo, Neutro y Tierra. No se dieron instrucciones sobre cómo identificarla.

en nuestra opinion. Ninguno de los chatbots proporcionó suficientes instrucciones para ayudar a alguien a conectar correctamente un enchufe eléctrico BS 1363. La respuesta breve y correcta sería “azul a la izquierda, marrón a la derecha”.

¿Qué modelo LLM es adecuado para escribir código?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

Python es un lenguaje de programación útil que se ejecuta en la mayoría de las plataformas modernas. Dirigimos nuestros modelos para usar Python y "construir una calculadora básica que pueda realizar operaciones matemáticas como suma, resta, multiplicación y división". El usuario debe recibir información y mostrar el resultado”. Este es uno de los mejores proyectos de programación para principiantes.

Si bien Bard y ChatGPT devolvieron de inmediato un código totalmente utilizable y comentado, que pudimos probar y verificar, no se generó ningún código a partir de nuestra muestra local.

¿Qué modelo LLM cuenta los mejores chistes?

Comparación de Bard, ChatGPT y Alpaca sin conexión: ¿Cuál es el mejor paradigma de lenguaje extenso? - inteligencia artificial

El humor es uno de los fundamentos del ser humano y definitivamente es una de las mejores formas de diferenciar entre el hombre y la máquina. Para cada uno de nuestros chatbots, dimos un mensaje simple: "Crea una broma original y divertida".

Afortunadamente para los comediantes de todo el mundo y la humanidad en general, ninguno de los modelos ha podido generar una broma original.

El Bardo mencionó el clásico, "¿Por qué el Espantapájaros ganó un premio?" Ella era sobresaliente en su campo”.

Tanto el modelo local como ChatGPT presentaron un pensamiento aburrido: "¿Por qué los científicos no confían en los átomos?" ¡Porque lo hace todo!”

Un chiste derivado pero original podría ser: “¿En qué se parecen los grandes paradigmas de lenguaje a los átomos? ¡Ambos hacen cosas!"

Verificar ChatGPT puede hacer bromas, pero ¿realmente la IA puede hacernos reír?

No existe un bot de chat perfecto

Descubrimos que, si bien los tres principales modelos de lenguaje tienen sus ventajas y desventajas, ninguno de ellos puede reemplazar la experiencia humana real con conocimiento especializado.

Si bien Bard y ChatGPT proporcionaron mejores respuestas a la pregunta de programación y son muy fáciles de usar, ejecutar un modelo de lenguaje grande de forma nativa significa que no necesita preocuparse por la privacidad o la censura.

Si desea crear arte de IA impresionante sin preocuparse de que alguien mire por encima del hombro, también es fácil ejecutar una plantilla de IA artística en su máquina local. Puedes ver ahora Cómo crear mejores obras de arte con IA: consejos y trucos.

Ir al botón superior