Descubre las 10 Aplicaciones Fascinantes de GPT-Vision, la Sensación del Momento

La fusión entre la tecnología de procesamiento del lenguaje natural y la visión por computadora ha sido finalmente realizada con el lanzamiento conjunto de ChatGPT y GPT-Vision. Cumpliendo estrictamente con la fecha límite del 15 de octubre, esta iniciativa marca un gran avance en la búsqueda de una inteligencia artificial más potente. Los ejemplos a continuación demuestran la variedad y profundidad de las posibles aplicaciones, abriendo así un amplio campo de exploración e innovación. Descubre cómo estas tecnologías están transformando la forma en que interactuamos con los datos visuales y textuales.

Exploración de las aplicaciones
La sinergia entre ChatGPT y GPT-Vision desbloquea funciones inéditas. Hemos seleccionado algunos ejemplos fascinantes que ilustran la diversidad de las posibles aplicaciones.

Modelado a partir de una imagen
Descubre aquí cómo una simple imagen se transforma en un impresionante modelo 3D:
ChatGPT Vision comenzando a escribir Gcode (para una Haas) a partir de impresiones pic.twitter.com/IgXeMEAS8e – Aaron Slodov (@aphysicist) 10 de octubre de 2023

Programa de entrenamiento personalizado según tu equipo
Déjate guiar por un programa de entrenamiento personalizado en función del equipo que tengas disponible:
ChatGPT Vision convirtió una imagen de mi equipo de gimnasio en un programa de entrenamiento completo de 8 semanas. Esto es mejor que el 99% de los programas que he comprado. pic.twitter.com/ToACYgzTyf – Rowan Cheung (@rowancheung) 11 de octubre de 2023
Y explora otras ideas de programas aquí:

Análisis y decodificación de documentos borrosos
Descubre cómo un documento borroso revela sus secretos gracias al análisis en profundidad:

Conversión de fotos en texto para una carta compleja
La tecnología convierte una imagen de una carta en texto editable:
???? ChatGPT Vision es una locura jajaja pic.twitter.com/Ccsl7tFgkD – peter! ???? (@pwang_szn) 4 de octubre de 2023

Recuperación de objetos complejos en una imagen
Explora cómo la tecnología identifica y recupera objetos complejos:
El poder de la capacidad de visión de ChatGPT ???? pic.twitter.com/cr1izVP9df – Kashan Ahmed????????‍???? (@KashanAhmed) 6 de octubre de 2023

Detección de imágenes de Google Street View o satélites
Una demostración precisa de detección de imágenes satelitales de Google Street View:
ChatGPT Vision pic.twitter.com/X619nlCdBW – Anu Aakash (@anukaakash) 11 de octubre de 2023

Análisis detallado de una radiografía
Un análisis de radiografía, aunque impresionante, se recomienda consultar a un especialista:
ChatGPT: El médico en tu bolsillo ???? ChatGPT ahora puede ver radiografías, recetas o informes médicos y responder cualquier pregunta en cuestión de segundos. ¡Habla del futuro de la salud: simple, rápido y con IA! pic.twitter.com/nXgEfEvEsn – Shubham Saboo (@Saboo_Shubham_) 6 de octubre de 2023

Análisis de imágenes complejas
Sumérgete en el análisis de una imagen altamente compleja:
ChatGPT-4V Multimodal, por favor descodifica esto. Gracias. pic.twitter.com/seOuma96QO – Brian Roemmele (@BrianRoemmele) 2 de octubre de 2023

Creación de escenarios a partir del análisis de varias imágenes
Descubre cómo cuatro imágenes distintas se convierten en un escenario coherente:
Le di a GPT-4V cuatro «fotogramas de película» que generé con Midjourney y le pedí que construyera una trama que los uniera. Un buen ejemplo de cómo la IA es más «creativa» y sorprendente cuando se le dan restricciones, al igual que los humanos. No es tan creativa como las mejores personas, pero interesante. pic.twitter.com/tzYJmMChsn – Ethan Mollick (@emollick) 2 de octubre de 2023

Análisis de un motor de automóvil
Un análisis minucioso de un motor de automóvil, una vez más, se recomienda consultar a un profesional:
6. Prompt de mantenimiento del automóvil: «Analiza el problema mostrado en esta foto del automóvil, explica las posibles causas y proporciona reparaciones de bricolaje o recomendaciones de servicio profesional». pic.twitter.com/mSfUTp0j5n – Bryan Marley (@_bryanmarley) 9 de octubre de 2023

Una mirada a la optimización del código gracias a esta tecnología:
8. Prompt de optimización de código: «Analiza este código y sugiere formas de mejorar el rendimiento, la eficiencia, la concisión y el cumplimiento de las mejores prácticas». pic.twitter.com/4leeDoVf53 – Bryan Marley (@_bryanmarley) 9 de octubre de 2023

Limitaciones notables
A pesar de los logros, persisten algunas limitaciones. Es importante tener en cuenta que la lectura de códigos QR y compartir conversaciones aún no están disponibles. Si no ves estas nuevas características, simplemente actualizar la página o cerrar y abrir sesión puede resolver el problema. Si persiste, borrar la caché relacionada con openai.com podría ser una solución a considerar. La captura de pantalla a continuación ilustra una de las interfaces de usuario de estas nuevas características:

Video de GPT-Vision

Por supuesto, debo dar crédito al excelente canal de YouTube de Emile Dev (síguelo si quieres estar al tanto de las últimas noticias sobre inteligencia artificial), que inspiró este artículo y aquí está el video de presentación:

Share your opinion

es_ESSpanish