Oriol Vinyals (Google DeepMind): “Sería mejor ir más despacio en la IA, pero el mundo va muy rápido, y es muy emocionante”
El vicepresidente de la división que ha creado Gemini cree que la inteligencia artificial cada vez estará más presente en voz, vídeos y robótica


Cuando Walter Benjamin escribió La obra de arte en su época de reproductibilidad técnica, en 1939, ya hacía un siglo que la fotografía había llegado al mundo con la invención del daguerrotipo, y más de 40 años desde que los hermanos Lumière inventaron el cinematógrafo. Sin embargo, tanto tiempo después filósofos como Benjamin estaban todavía reflexionando y sorprendidos ante la irrupción de estas tecnologías y la capacidad que tenían de desligar la experiencia humana de los procesos técnicos. Ahora, los tiempos de la tecnolgía van tan acelerados que entender lo que está pasando parece una tarea imposible. A veces incluso para quienes están detrás de estas innovaciones. La última vez que EL PAÍS entrevistó a Oriol Vinyals, en diciembre de 2022, la inteligencia artificial apenas empezaba a llegar masivamente a las masas de usuarios mediante programas de texto o imagen como ChatGPT. Tres años después, y sin haberlo casi podido digerir, todos los programas informáticos están incorporando esta herramienta, los científicos la usan para probar sus teorías, los artistas la empiezan a tener como un elemento más de su paleta, es casi imprescindible para los estudiantes y hasta funciona de psicólogo. Todo ello, con riesgos e incertidumbres que aumentan a medida que la tecnología es cada vez más precisa y asombrosa.
Vinyals (Sabadell, 42 años) reconoce que la cosa está yendo muy deprisa, aunque admite que las exigencias del mercado y la “emoción” de estar haciendo algo comparable a ir a la Luna impiden bajar el ritmo. Pese a los rumores de que pueda haber una burbuja en el negocio de la IA, el dinero sigue fluyendo y los técnicos no desaprovechan la oportunidad. Vinyals siente la responsabilidad del momento, puesto que es uno de los mayores expertos en IA del mundo, vicepresidente de Google DeepMind, la compañía inglesa que Alphabet, la matriz de Google, compró en 2014 para enfocarse en la técnica del aprendizaje profundo (deep learning) de la IA. El principal producto de DeepMind es Gemini, el motor de IA que hace la competencia a ChatGPT, y que la semana pasada sacó su versión 3.0. De esta compañía también salió el célebre AlphaGo, que ganó con creatividad al campeón mundial del juego del go, AlphaStar, que juega y gana en el videojuego StarCraft II, uno de los favoritos de Vinyals, o AlphaFold, una IA que predice la estructura de las proteínas y cuyos impulsores ganaron el premio Nobel de química el año pasado.
Matemático e ingeniero de telecomunicaciones por la UPC, es investido este miércoles como doctor honoris causa por esta universidad, de la que salió como una joven promesa que iba a los exámenes casi sin estudiar, se doctoró en Berkeley y de ahí a ser una de las principales referencias en IA. Científico archicitado, Vinyals todavía piensa en los misterios de cómo hablaba el ordenador Hal en la película 2001: Una odisea del espacio, que vio por primera vez con ocho años.
Pregunta: Hace tres años que la IA entró en nuestras vidas. ¿Qué ha pasado?
Respuesta: Voy a intentar resumirlo. La tecnología que usamos hoy es similar a la de hace décadas, lo que hacemos es ir refinando la receta. Pero es el mismo intento de emular cómo funcionan las conexiones neuronales de nuestro cerebro. Yo empecé en esto en 2007, cuando esto estaba solo en el ámbito científico, en las publicaciones. En 2013 entré en Google, y durante cuatro o cinco años seguimos investigando y publicando, pero nos dábamos cuenta de que esta tecnología podía servir para algo más grande que la propia investigación. A partir de ahí hubo momentos clave, grandes demostraciones como el AlphaGo o el AlphaStar, lo que puso a la IA ante el gran público, o AlphaFold, que revolucionó la biología. Entonces en 2016 se creó la startup OpenAI, que decidió no hacer publicaciones científicas, sino enfocarse en dar un paso grande hacia una inteligencia más potente. Lo logró con el ChatGPT, que al ser un modelo de lenguaje demostró que además de científicamente interesante era muy útil, y se popularizó como aplicación hace tres años. En 2019 nosotros también nos enfocamos en intentar hacer un modelo de lenguaje muy potente, y terminamos uniendo los modelos que estábamos investigando en Google Brain y Google DeepMind, para un proyecto nuevo que fue Gemini. Al principio no era tan bueno, pero hemos ido mejorando la receta y ahora está en la liga superior.
P: ¿Qué novedades tiene la versión 3.0 de Gemini?
R: Todo parece bastante similar, pero la calidad aumenta mucho y las posibilidades de lo que se puede hacer también. La capacidad de crear imágenes, con el motor Nano Banana Pro, es mucho más potente. También es mucho mejor en código, en capacidades matemáticas, de razonamiento, y hemos mejorado su personalidad.
P: ¿Cómo se explican las alucinaciones o los bucles?
R: Sí, ocurre, que te dice cosas que no existen, por ejemplo. Es difícil explicarlo, depende del tipo de problema. Vamos haciendo pruebas. Por ejemplo hay una que es preguntarle cuántas letras tiene strawberry, y siempre dice que tiene dos. Claro, tenemos el resultado, pero no cómo ha llegado a él, no puedes mirar dónde en el código algo ha fallado, porque no es un programa, es una red neuronal. Tampoco podemos entender cómo funciona exactamente el proceso mental que lleva al cerebro a dar una respuesta. Entonces lo que nos ayuda a entenderlo es hacerle razonar en forma de lenguaje, preguntarle por qué te ha dado esta respuesta, que haga introspección. Entonces podemos leer e interpretar. La explicación de por qué hay errores en la IA es también que en Internet hay errores, y el modelo de lenguaje saca sus respuestas de ahí, se entrena con el contenido de Internet y consigo mismo. Tenemos maneras de ir mejorando, pero igual que los usuarios de Internet saben que no todo lo que encuentran es real, también lo tienen que saber sobre la IA.
P: ¿Cree que el usuario es consciente de ello siempre? Si ustedes mismos se asombran...
R: Sí, es una tecnología nueva con unas posibilidades buenas increíbles, pero... El problema es que los cambios que veremos serán más rápidos que otros cambios tecnológicos. Demis Hassabis, el consejero delegado de DeepMind, dijo que lo que ocurre hoy es 10 veces mayor y más rápido que la revolución industrial. Pero los usuarios nos hemos ido adaptando a las diferentes tecnologías. La educación empieza por nosotros mismos, por el sentido común. Y las compañías tenemos que ir mejorando.
P: Habla de personalidad de la IA. ¿Hasta qué punto podemos decir que es o será como nosotros?
R: Ahora mismo ya está claro que los modelos no solo interpolan, es decir, sacan un resultado entre dos cosas. También tienen creatividad. No en todos los aspectos, pero claramente en algunos logran dar con ideas nuevas. Es por su capacidad: en ciencia, son capaces de leer todos los artículos de dos campos totalmente diferentes, y hacer conexiones que nadie antes ha tenido tiempo de hacer. Esto está ayudando a hacer lluvia de ideas con los científicos. En matemáticas pasa igual: Terence Tao, dicen que el mejor matemático del mundo, usa la IA para iterar procesos. Es un compañero para la investigación. No es imposible pensar que una IA pueda solucionar uno de los problemas matemáticos más complejos. Por la escala: una persona puede tardar 50 años en solucionar la hipótesis de Riemann, pero es que para estos modelos un día es equivalente a 600 años.

P: Geoffrey Hinton y otros padrinos de la IA han alertado sobre sus riesgos. ¿Cuál es la responsabilidad de investigadores y compañías en estas amenazas?
R: Con Geoffrey hemos publicado mucho juntos y fuimos colegas en Google. En la comunidad científica nunca nadie está de acuerdo con todos de la misma forma. Es bueno que haya voces en todos los sentidos. Hay quien ve mucho peligro y hay quien no ve ninguno, yo estoy en el centro. Y Google, no puedo hablar por otras compañías, es responsable a la hora de lanzar sus modelos, lleva muchos años invirtiendo. También es verdad que si no lanzas los modelos para el gran público no podrás ver tan rápido los problemas que tienen. En estos momentos hay una carrera entre varias compañías, y hay que estar ahí pero también prever las repercusiones.
P: ¿Nos arrepentiremos de estar yendo tan rápido?
R: Yo pienso como científico pero también como padre, pienso el mundo que vendrá y cómo cambiará el entorno laboral, las relaciones. Pienso profundamente en las repercusiones, en si es bueno que los jóvenes tengan acceso a chatbots. No tenemos tiempo de hacer estudios, pero ayuda pensar en el propio riesgo para hacerlo bien. Sí, sería preferible ir más despacio, tener más tiempo para entender qué cosas son buenas y qué cosas no. Pero es difícil en esta dinámica, el mundo va muy rápido y hay muchos incentivos. También es emocionante, es un momento histórico, como cuando se fue a la Luna. Hay mucho optimismo, mucha energía, mucha capacidad económica. Es complicado que se pare o se ralentice. Pero espero que si tenemos suficientes datos de que una cosa no va bien podamos frenar un poco.
P: ¿Cómo afectó a la carrera la llegada de la china DeepSeek?
R: Con un equipo pequeño lo hicieron bien, supieron copiar lo que se estaba haciendo. Pero los modelos que están más arriba son los de Google y Open AI. El tema es que en algunas aplicaciones quizá habrá un techo al que todos llegaremos, quizá habrá un momento en el que todas las IA hablen perfectamente inglés y en ese aspecto no haya más recorrido. En este sentido no tuvo mucha repercusión. La tuvo en la geopolítica, porque China y EE UU son los principales competidores.
P: ¿Y Europa puede ser competitiva? ¿Qué opina de la regulación que impulsa?
R: Sí bueno, sin comentarios. A ver, DeepMind está en Londres, en el entorno europeo, y hay algunas startups potentes como Mistral, pero en temas de inversión de capital, y si miras dónde están los centros de datos, las infraestructuras... todas están en EE UU o China.
P: ¿Les preocupa el impacto energético de los centros de datos?
R: Google tiene la promesa de ser neutral en emisiones contaminantes y lo estamos consiguiendo, porque nuestros centros de datos producen CO2 pero tenemos inversiones sostenibles que lo compensan. También, tras las inversiones iniciales los costes energéticos van a ser más eficientes, también porque el entreno de las IA será más eficiente. La propia IA puede ayudarnos a descubrir materiales o tecnologías que solucionen el problema de los gases invernadero. Por ejemplo, uno de los temas en los que estamos enfocados es en investigar la fusión nuclear. Podría llegar antes gracias a la IA.
P: Ahora interactuamos con la IA sobre todo en texto e imagen. ¿Qué vendrá en un futuro cercano?
R: Lo más natural es que venga en forma de voz, que hablemos y conversemos con la IA, sin que eso sustituya al texto. Otra forma es que la IA cree vídeos, pequeños tutoriales para explicarnos cosas. Esto lo veremos pronto. Y luego algo que no es tan inminente pero que puede ser factible en cinco años, porque hay mucha inversión en ello, es la robótica. Interactuaremos con robots humanoides, igual que ya lo hacemos con coches sin conductor. La tecnología existe, pero falta dar con la fórmula para que eso sea accesible y útil para el gran público.
Tu suscripción se está usando en otro dispositivo
¿Quieres añadir otro usuario a tu suscripción?
Si continúas leyendo en este dispositivo, no se podrá leer en el otro.
FlechaTu suscripción se está usando en otro dispositivo y solo puedes acceder a EL PAÍS desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripción a la modalidad Premium, así podrás añadir otro usuario. Cada uno accederá con su propia cuenta de email, lo que os permitirá personalizar vuestra experiencia en EL PAÍS.
¿Tienes una suscripción de empresa? Accede aquí para contratar más cuentas.
En el caso de no saber quién está usando tu cuenta, te recomendamos cambiar tu contraseña aquí.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrará en tu dispositivo y en el de la otra persona que está usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aquí los términos y condiciones de la suscripción digital.
Sobre la firma



































































