Cómo crear una instancia personalizada de ChatGPT con tus datos privados

Al proporcionar la tecnología GPT en un bot de chat potente pero fácil de usar, ChatGPT se ha convertido en el modelo de IA más popular del mundo. Mucha gente lo usa para iniciar conversaciones interesantes, responder preguntas, hacer sugerencias creativas y ayudar con la programación y la escritura. Sin embargo, ChatGPT está limitado porque no puede almacenar sus datos para uso personal a largo plazo, y el principal inconveniente es que tiene datos de conocimiento hasta septiembre de 2021.

Alternativamente, se puede usar una API de OpenAI y LangChain para proporcionar a ChatGPT datos e información personalizados actualizados después de 2021 para crear una instancia personalizada de ChatGPT. Verificar ChatGPT vs Google Bard: ¿Qué paradigma es mejor para la programación?

¿Por qué querrías crear ChatGPT con datos personalizados?

Alimentar ChatGPT con datos personalizados y proporcionar información actualizada más allá de la fecha de vencimiento del conocimiento brinda muchos beneficios más allá del uso habitual de ChatGPT. Éstos son sólo algunos de ellos:

  1. Interacciones específicas: al proporcionar ChatGPT con datos personalizados, los usuarios pueden crear una experiencia más personalizada. El modelo se puede entrenar en conjuntos de datos específicos relevantes para usuarios individuales u organizaciones, lo que da como resultado respuestas adaptadas a sus necesidades y preferencias únicas.
  2. Experiencia de campo: La integración de datos personalizados permite que ChatGPT se especialice en áreas o industrias específicas. Puede capacitarse en conocimientos, terminología y tendencias específicas de la industria, lo que permite respuestas más precisas y detalladas en esas áreas específicas.
  3. Información actual y precisa.: El acceso a información actualizada garantiza que ChatGPT se mantenga actualizado con los últimos desarrollos y conocimientos. Puede proporcionar respuestas precisas basadas en eventos, noticias o investigaciones recientes, lo que la convierte en una fuente de información más confiable.

Ahora que comprende la importancia de proporcionar datos personalizados a ChatGPT, aquí hay un paso a paso sobre cómo hacerlo en su computadora local.

Paso 1: instale y descargue aplicaciones y scripts prefabricados

Tenga en cuenta que las siguientes instrucciones son para un dispositivo con Windows 10 o Windows 11.

Para proporcionar datos personalizados a ChatGPT, deberá instalar y descargar la última versión de Python3, Git, Microsoft C++ y el script de recuperación de ChatGPT de GitHub. Si ya tiene algunas aplicaciones instaladas en su computadora, asegúrese de actualizarlas con la última versión para evitar contratiempos durante el proceso.

Comience con la instalación:

descargar: Python3 (Gratis)

descargar: Git (Gratis)

descargar: Herramientas de compilación visual de Microsoft (Gratis)

Notas sobre la instalación de Python3 y Microsoft C++

Al instalar Python3, asegúrese de seleccionar una opción Agregue python.exe a la RUTA antes de hacer clic INSTALAR AHORA. Esto es importante porque le permite acceder a Python en cualquier directorio de su computadora.

Al instalar Microsoft C++, primero deberá instalar Microsoft Visual Studio Build Tools. Una vez instalado, puede seleccionar la opción Desarrollo de escritorio con C++ y hacer clic en Instalar con todas las herramientas opcionales seleccionadas automáticamente en la barra lateral derecha.

Ahora que tiene instaladas las últimas versiones de Python3, Git y Microsoft C++, puede descargar un script de Python para consultar fácilmente datos locales personalizados.

descargar: Script de recuperación de ChatGPT (Gratis)

Para descargar el script, haga clic en Código , Luego seleccione Descargar ZIP. Esto debería descargar el script de Python en el directorio predeterminado o especificado.

Una vez descargado, ya podemos configurar un entorno local. Verificar Cómo usar ChatGPT para dominar el arte de contar historias.

Paso 2: configurar el entorno local

Para configurar el entorno, deberá abrir Terminal en la carpeta chatgpt-recovery-main que descargó. Para hacer esto, abra la carpeta chatgpt-recovery-main, haga clic derecho y seleccione Abrir en Terminal.

Una vez que se abra la Terminal, copie y pegue este comando:

pip install langchain openai chromadb tiktoken unstructured

Este comando usa el administrador de paquetes de Python para crear y administrar el entorno de Python virtual requerido.

Después de crear el entorno virtual, debemos proporcionar una clave API de OpenAI para acceder a sus servicios. Primero necesitaremos generar una clave API desde el sitio de claves API OpenAI Haciendo click Crear una nueva clave secreta y agregue un nombre a la clave, luego presione el botón Crear una clave secreta.

Se le presentará una cadena de caracteres. Esta es su clave API de OpenAI. Cópielo haciendo clic en el icono de copia junto a la clave API. Tenga en cuenta que la clave API debe mantenerse en secreto. No lo comparta con otros a menos que realmente tenga la intención de que lo usen con usted.

Una vez copiado, vuelva a la carpeta chatgpt-recovery-main y abra el archivo Constants con el Bloc de notas. Ahora reemplace el marcador de posición con su clave API. ¡Recuerda guardar el archivo!

Ahora que configuró con éxito su entorno predeterminado y agregó su clave API de OpenAI como una variable de entorno. Ahora puede enviar sus datos personalizados a ChatGPT.

Paso 3: Agrega los datos personalizados

Para agregar datos personalizados, coloque todos sus datos de texto personalizados en la carpeta Datos dentro de chatgpt-recovery-main. El formato de datos de texto puede estar en formato PDF, TXT o DOC.

Como puede ver en la captura de pantalla anterior, agregué un archivo de texto con una tabla personal configurada y un artículo que escribí sobre Aceleradores Instinct de AMD y un documento PDF.

Paso 4: consulta información usando ChatGPT a través de Terminal

El script de Python permite consultar información de los datos personalizados que hemos añadido a la carpeta Datos e Internet. En otras palabras, tendrá acceso al backend habitual de ChatGPT y a todos los datos almacenados localmente en la carpeta de datos.

Para usar el script, ejecute chatgpt.py Luego agregue su pregunta o consulta como argumento.

python chatgpt.py “YOUR QUESTION”

Asegúrese de poner sus preguntas entre comillas.

Para probar si hemos alimentado con éxito nuestros datos a ChatGPT, voy a hacer una pregunta personal sobre el perfil de Sched.txt.

¡El modelo funcionó! Esto significa que ChatGPT pudo leer el perfil aprovisionado anteriormente. Ahora veamos si logramos proporcionar información a ChatGPT que no conoce debido a la fecha desactualizada de la base de conocimiento.

Como puede ver, describió correctamente el AMD Instinct MI250x, que se lanzó después de la fecha de interrupción de la base de conocimientos para ChatGPT -3.

Límites de instancias personalizadas de ChatGPT

Aunque la alimentación de datos personalizados de GPT-3.5 abre más formas de implementar y usar LLM, existen algunos inconvenientes y limitaciones.

Primero, debe proporcionar todos los datos usted mismo. Todavía puede acceder a todo el conocimiento para GPT-3.5 hasta la fecha de finalización del conocimiento; Sin embargo, debe proporcionar todos los datos adicionales. Esto significa que si desea que su modelo local esté al tanto de un tema específico en Internet que GPT-3.5 aún no conoce, tendrá que conectarse y raspar los datos usted mismo y guardarlos como texto en el chatgpt- carpeta de datos principales de recuperación.

Otro problema es que una consulta personalizada en ChatGPT tarda más en cargarse en comparación con una consulta directa de ChatGPT.

Finalmente, el único modelo disponible actualmente es el GPT-3.5 Turbo. Entonces, incluso si tiene acceso a GPT-4, no podrá usarlo para ejecutar su propia instancia dedicada de ChatGPT. Verificar Aplicaciones que han integrado el modelo GPT-4 en su núcleo, pero ¿cómo funcionan?

El chat dedicado es genial, pero es limitado.

Proporcionar datos personalizados a ChatGPT es una forma eficiente de aprovechar al máximo su formulario. Con este método, puede alimentar el formulario con cualquier dato de texto que desee y reclamarlo como ChatGPT normal, aunque con algunas limitaciones. Sin embargo, esto cambiará en el futuro a medida que sea más fácil integrar nuestros datos con LLM, junto con el acceso al último modelo GPT-4. Puedes ver ahora Señales de que estás hablando con un bot de IA.

DzTech

Soy ingeniero estatal con amplia experiencia en los campos de programación, creación de sitios web, SEO y redacción técnica. Me apasiona la tecnología y me dedico a brindar información de calidad al público. Puedo convertirme en un recurso más valioso para los usuarios que buscan información precisa y confiable sobre reseñas de productos y aplicaciones especializadas en diversos campos. Mi compromiso inquebrantable con la calidad y la precisión garantiza que la información proporcionada sea confiable y útil para la audiencia. La búsqueda constante de conocimiento me impulsa a estar al día con los últimos avances tecnológicos, asegurando que las ideas compartidas se transmitan de forma clara y accesible.
Ir al botón superior