
La Google I/O ’25 ha marcado un antes y un después, señalando el inicio de una nueva fase en la revolución de la Inteligencia Artificial (IA). Décadas de investigación pionera están cristalizando en soluciones tangibles que impactarán la vida de personas en todo el mundo. La keynote de este año ha sido un testimonio del progreso implacable en IA y un cambio fundamental en la frontera tecnológica, prometiendo más inteligencia accesible para todos, en todas partes. Los pilares de esta transformación son la inteligencia (con los modelos Gemini), los agentes de IA y una personalización sin precedentes.
La visión es clara: hacer que la IA sea más personal, proactiva y potente. Esto se traduce en una avalancha de aplicaciones y productos innovadores diseñados no solo para informar, sino para actuar y ayudarte a «hacer cosas» (get stuff done).
Gemini: La Evolución Hacia un Asistente Universal de IA
La aplicación Gemini se posiciona como el epicentro de esta transformación, aspirando a convertirse en un asistente de IA universal, verdaderamente personal, proactivo y potente. Con una base de usuarios que ya supera los 400 millones activos mensuales y un incremento del 45% en el uso de los modelos 2.5 Pro, Gemini está listo para redefinir nuestra interacción con la tecnología.
Se anunciaron cinco novedades clave que potenciarán la aplicación Gemini:
Gemini Live: Conversaciones Interactivas y Naturales
Gemini Live permite mantener conversaciones fluidas y naturales, ahora enriquecidas con capacidades de cámara y pantalla compartida. Los usuarios ya lo están utilizando para prepararse para entrevistas de trabajo o entrenar para maratones. Próximamente, se integrará con aplicaciones esenciales como Calendar, Maps, Keep y Tasks. Esta funcionalidad se lanzará de forma gratuita en Android e iOS.
Modo Agente: Tu IA Trabajando en Segundo Plano
Una característica emergente y revolucionaria. El Modo Agente permite a Gemini «trabajar tras bastidores» para ejecutar tareas complejas. Combina la inteligencia de Gemini con el acceso a herramientas y las capacidades de uso de computadoras de Project Mariner. Un ejemplo práctico fue la búsqueda de un apartamento con criterios específicos, navegando por sitios como Zillow, ajustando filtros y programando visitas mediante el Model Context Protocol (MCP). Incluso puede continuar la búsqueda de nuevas opciones de forma autónoma. Una versión experimental estará disponible pronto para suscriptores.
Deep Research: Investigación Guiada por Tus Archivos
Con Deep Research, podrás cargar tus propios archivos para orientar la investigación del agente. Próximamente, esta capacidad se extenderá para investigar directamente a través de tu Google Drive y Gmail, personalizando aún más los resultados.
Canvas: Co-creación Interactiva y Visual
Canvas es un espacio de co-creación dentro de Gemini. Permite transformar informes detallados en formatos visualmente atractivos y fáciles de digerir con un solo toque, como páginas web dinámicas, infografías, cuestionarios o podcasts personalizados. También introduce el «vibe code» (programación intuitiva) para crear elementos como simulaciones interactivas.
Creación Avanzada de Imágenes y Videos
Se integra el modelo de generación de imágenes más reciente, Imagine 4, con mejoras notables en calidad, representación de texto y velocidad (hasta 10 veces más rápido). Además, se presenta Veo 3, el modelo de video de vanguardia, que ahora incluye generación de audio nativa, creando efectos de sonido, ruido de fondo y diálogos realistas.
Google Search: Reimaginado con IA Agentiva y Personalizada
Google Search, el producto insignia de Google en su misión de organizar la información mundial, está experimentando una transformación radical gracias a la IA. Se vuelve más inteligente, agentivo y profundamente personalizado.
AI Overviews: Un Éxito Escalable
Lanzados el año pasado, los AI Overviews ya cuentan con más de 1.500 millones de usuarios mensuales en más de 200 países. Han impulsado un crecimiento superior al 10% en las consultas que los muestran en mercados clave y son uno de los principales motores de crecimiento para las búsquedas visuales en Google Lens.
Modo IA (AI Mode): La Próxima Generación de Búsqueda
Presentado como el siguiente gran salto, el Modo IA es una reinvención total de la búsqueda. Con Gemini 2.5 en su núcleo, ofrece la búsqueda de IA más potente. Permite consultas mucho más largas y complejas (2-3 veces la longitud tradicional) y facilita el seguimiento con preguntas adicionales. El Modo IA utiliza «query fanout», una técnica que descompone la pregunta en subtemas, realiza múltiples búsquedas simultáneas en la web y bases de datos (Knowledge Graph, Shopping Graph, datos locales) y sintetiza una respuesta validada. Se está lanzando para todos los usuarios en EE.UU. desde hoy.
Personalización Profunda en Modo IA
Próximamente, las sugerencias en Modo IA podrán personalizarse basándose en tu historial de búsquedas. De forma opcional, podrás conectar otras apps de Google (empezando por Gmail) a través del «contexto personal» para recibir recomendaciones adaptadas (ej: sugerencias de restaurantes con asientos al aire libre basadas en reservas recientes, o exhibiciones de arte por newsletters recibidas). Esta funcionalidad siempre estará bajo el control del usuario.
Deep Search: Informes a Nivel Experto
Una capacidad que llegará pronto a AI Mode en labs. Utiliza el «query fanout» multiplicado (docenas o cientos de búsquedas) para generar informes detallados, completamente citados y a nivel experto en cuestión de minutos.
Search Live: La Búsqueda Interactúa con tu Entorno
Integra las capacidades en vivo de Project Astra en AI Mode. Usando la cámara de tu dispositivo, la búsqueda puede «ver» lo que tú ves y ofrecer información útil en tiempo real, como si estuvieras en una videollamada con la propia búsqueda. Ideal para reparaciones, tareas escolares o aprender nuevas habilidades.
Compras Visuales y Checkout Agentivo Inteligente
AI Mode integra Google Images y el Shopping Graph (con más de 50 mil millones de listados de productos) para revolucionar la experiencia de compra. Permite obtener inspiración visual, encontrar productos personalizados (por estilo, tamaño familiar, etc.) y recibir recomendaciones (ej: alfombras lavables). Se introduce una función de prueba virtual que usa un modelo de generación de imágenes entrenado en moda para mostrar cómo te quedarían las prendas. Finalmente, la función de checkout agentivo podrá rastrear el precio de un artículo y, si alcanza tu objetivo, añadirlo al carrito y comprarlo de forma segura con Google Pay con un solo toque, siempre bajo tu supervisión.
Agentes de IA: El Poder de la IA para Actuar en tu Nombre
Los agentes de IA se definen como sistemas que combinan la inteligencia de modelos avanzados con acceso a herramientas, permitiéndoles realizar acciones en nombre del usuario y bajo su estricto control. La capacidad de «uso de computadoras» es una habilidad agentiva clave, permitiendo a estos agentes interactuar con navegadores y software.
Project Mariner: Capacidades de Uso de Computadoras Avanzadas
Este prototipo de investigación, liberado inicialmente en diciembre, ha evolucionado para incluir multitarea (supervisando hasta 10 tareas simultáneamente) y la función «enseñar y repetir» (mostrar una tarea una vez para que el agente aprenda un plan). Las capacidades de Project Mariner se están llevando a los desarrolladores a través de la Gemini API y estarán disponibles más ampliamente este verano. Es un componente crucial del Modo Agente en la app Gemini y en Search AI Mode.
Construyendo un Ecosistema de Agentes Abierto
Google está fomentando activamente un ecosistema de agentes con herramientas y protocolos como el protocolo abierto agente a agente (que permite la comunicación entre diferentes agentes, lanzado en Cloud Next con más de 60 socios) y la compatibilidad con el Model Context Protocol (MCP) de Anthropic (que permite a los agentes acceder a otros servicios). La Gemini SDK ahora es compatible con herramientas MCP.
Aplicaciones Agentivas Directas en Productos Google
Además del Modo Agente en la app Gemini, las capacidades agentivas se están desplegando en Chrome, Search y la API de Gemini. En Search AI Mode, esto se traducirá pronto en ayuda para tareas como encontrar entradas para eventos, hacer reservas en restaurantes y programar citas para servicios locales. También se mencionó a Jules, un agente de codificación asíncrono capaz de manejar tareas complejas en grandes bases de código e integrarse con GitHub.
IA en Todos los Frentes: Del Código a la Ciencia y el Mundo Físico
La ambición de Google con la IA va mucho más allá de las conversaciones y la búsqueda, abarcando una amplia gama de dominios.
Herramientas Potenciadas para Desarrolladores
Se destaca la creciente adopción de la Gemini API, con más de 7 millones de desarrolladores construyendo sobre ella (un crecimiento de 5x respecto al I/O anterior) y un aumento de más del 40x en el uso de Gemini en Vertex AI. Se anunciaron actualizaciones a los modelos, incluyendo el eficiente Gemini Flash 2.5 (disponible pronto) y un adelanto de Deep Think para 2.5 Pro, que lleva el rendimiento al límite usando técnicas avanzadas de pensamiento y razonamiento. Se introducen «presupuestos de pensamiento» para ofrecer control sobre el costo y la latencia.
IA Impulsando el Descubrimiento Científico
La IA se está aplicando en áreas críticas como matemáticas (AlphaProof), colaboración en investigación (Co-scientist), descubrimiento de conocimiento (Alpha Revolve), diagnóstico médico (Amy) y predicción de estructuras moleculares (AlphaFold 3, Isomorphic Labs). AlphaFold ya es una herramienta estándar, utilizada por más de 2.5 millones de investigadores.
Medios Generativos y Creatividad Exponencial
Herramientas como Music AI Sandbox y Lyria 2 permiten la generación de música de alta fidelidad. El modelo VO3 genera video con audio integrado. Se introduce Flow, una herramienta de creación de películas que combina VO, Imagine y Gemini, permitiendo a los creativos fusionar sus propios activos, generar nuevos, ensamblar clips con instrucciones precisas y extender secuencias. Para abordar los desafíos del contenido generado, se expande Synth ID para marcar y detectar contenido generado por IA en imágenes, audio, texto y video.
IA en Android y la Emergente Realidad Extendida (XR)
Gemini se está expandiendo más allá del teléfono para integrarse en relojes, tableros de coche y televisores. Se presenta Android XR, la primera plataforma Android construida en la era Gemini, destinada a dispositivos como headsets y gafas. Project Muhan de Samsung es el primer dispositivo Android XR. Se están desarrollando gafas Android XR ligeras con cámara, micrófonos, altavoces y pantalla en la lente, permitiendo interactuar con Gemini en contexto visual y auditivo. Socios como Gentle Monster y Warby Parker construirán gafas con Android XR.
Impacto Tangible en el Mundo Real
Se mostraron ejemplos conmovedores de cómo la IA ayuda a la sociedad. Firesat utiliza imágenes satelitales multiespectrales e IA para detectar incendios casi en tiempo real. Wing, en colaboración con Walmart y la Cruz Roja, realizó entregas de drones apoyadas por IA para ayuda humanitaria. Se mencionaron también avances en robótica (Gemini Robotics) y vehículos autónomos (Waymo).
Personalización y Control del Usuario: IA a tu Medida y Bajo tus Términos
La personalización es fundamental para que la IA sea verdaderamente útil. A través del «contexto personal», y siempre con el permiso explícito del usuario, los modelos Gemini pueden utilizar información relevante de las aplicaciones de Google de forma privada, transparente y bajo control total. Esto habilita experiencias como respuestas de email que suenan auténticamente como el usuario o recomendaciones de búsqueda hiper-personalizadas. También se mencionaron controles para desarrolladores y usuarios sobre cómo los modelos utilizan los recursos, como los «presupuestos de pensamiento».
Una Nueva Era de Descubrimiento y Potencial Ilimitado con la IA
Google I/O ’25 nos presenta un futuro donde la IA no es solo una herramienta, sino un motor poderoso para el descubrimiento y un asistente que entiende el mundo y puede actuar proactivamente en tu nombre. La inversión sostenida en infraestructura y la investigación fundamental están impulsando esta ola de innovación. Con las suscripciones a Google AI Pro y Ultra, los usuarios pueden acceder a estas capacidades de frontera.
La oportunidad con la IA es verdaderamente tan grande como podamos imaginar, con el potencial de mejorar vidas, acelerar el progreso científico y traer una nueva edad de oro de descubrimiento y asombro. Desde la ayuda diaria en la aplicación Gemini y Google Search, hasta el impacto transformador en la ciencia, la creatividad y la respuesta a emergencias, la IA está haciendo posible un futuro asombroso.
Adjuntamos video original de Google I/O ’25 Keynote