Sora, Gemini 2.0 i el xip quàntic Willow: la IA tanca el 2024 transformant la tecnologia
IBM accelera la sostenibilitat en centres de dades, Meta llança Llama 3.3 amb 100 milions d’usuaris, Apple integra ChatGPT gratuït amb Siri i Brussel·les tria Barcelona per a la seva primera fàbrica d’IA
Imatge generada amb Grok 2 per Saül Gordillo.
Poques setmanes tan productives com aquesta en el món de la Intel·ligència Artificial. Abans d’acabar el 2024, Google i OpenAI han protagonitzat una sèrie d’anuncis rellevants, però IBM, Meta, xAI i Apple tampoc s’han quedat de braços plegats. Arribem a final d’any amb la sensació d’una democratització de la IA generativa com mai abans, amb Sora ja disponible per a tots els usuaris premium de ChatGPT, excepte per als europeus i ciutadans d’algunes dictadures. Els usuaris de l’esperada eina de generació de vídeo d’OpenAI —una llarga espera durant la qual han sorgit alternatives realment competitives— han detectat que Sora no és tan bona com mostraven les demostracions de fa uns mesos, tant en els moviments com en les imatges hiperrealistes. Caldrà veure si és una censura buscada per OpenAI per complir amb la legislació o si realment es tracta d’una limitació de l’eina. Sora incorpora marques d’aigua visibles, metadades integrades per a la traçabilitat i prohibicions estrictes contra la generació de contingut amb drets d’autor, representacions de menors i material explícit.
L’arribada de Sora al gran públic després de setmanes i mesos d’avantatge dels seus competidors posa de manifest un aspecte que semblava superat amb la IA generativa en altres formats: la importància del ‘prompting’. Semblava que l’habilitat a l’hora de donar instruccions o saber iterar era cada vegada menys rellevant, però quan es tracta de generar vídeo, amb Sora, Gen-3 Alpha de Runway o Tencent de Hunyuan Video, entre d’altres, l’encert de qui utilitza aquestes IA amb ordres textuals és molt rellevant. Ja arribarà el moment en què sigui facilíssim generar vídeo de qualitat o espectacularitat amb poc esforç o professionalitat. El vídeo va darrere del text i la imatge. Amb Sora, es popularitzaran els clips i, malgrat les restriccions per evitar deepfakes, assistirem a un boom del vídeo amb IA pròximament. Sora arriba deu mesos tard, amb el fre de mà posat per part d’OpenAI i amb l’exclusió de la Unió Europea i altres països poc exemplars, però la capacitat de marcar tendència de la companyia de Sam Altman és fora de dubte. Només cal veure la campanya de màrqueting que han fet amb el calendari d’advent nadalenc i els regals-anuncis d’OpenAI que cada nit ens tenen tots pendents dels seus directes.
Google ha donat un cop sobre la taula aquesta setmana. Ha presentat Willow, un xip quàntic que resol en 5 minuts una tasca que abans ocuparia quatrilions d’anys a un superordinador. També ha presentat Trillium, un xip potent per a la seva IA Gemini 2.0, que afegeix funcions multimodals i desafia els seus competidors. Google fa un pas important en l’era dels agents d’IA. Gemini 2.0 vol jugar la partida. Google també ha convertit el projecte Jarvis en Mariner i ha fet de Jules el salvavides autèntic per als programadors. El que ha fet aquesta setmana la companyia de Sundar Pichai és molt important. Pichai ha advertit de canvis rellevants en el cercador de Google a partir de principis del 2025. Així que venen corbes.
Si vostè, apreciat lector, és un dels afortunats amb una subscripció a Algoritme Transparent i fins ara vivia allunyat de l’actualitat de la IA, sap que arriba en el millor moment. Aquesta setmana és un punt d’inflexió per Sora, per les presentacions de Google, pel llançament d’OpenAI d’un ChatGPT Pro a 200 dòlars mensuals com a IA de raonament bestial, productiu i robust, però també per tot un seguit de novetats d’altres actors tecnològics i per les expectatives del segon mandat de Donald Trump a la Casa Blanca i la influència sobre Javier Milei i per la influència d’Elon Musk, que només n’hi ha un.
Musk deu ser lector d’Algoritme Transparent perquè si la setmana passada dèiem que Grok dins de X (antic Twitter) és una integració atractiva i estimulant, ara acaba d’anunciar que serà gratuïta. L’eina de generació d’imatge de Grok, amb resultats hiperrealistes sense censura i un punt punk, ja és perceptible a la xarxa social X, marcant un nou escenari i contribuint a un imaginari de la IA més alliberador. Estimat lector, prengui nota de tot el que passa i no dubti a provar aplicacions i eines perquè té la sort d’arribar en el moment oportú i de no haver-se perdut res tan rellevant dels dos últims anys: ara això va de debò tant com a usuari com en el món de l’empresa. L’avantatge que alguns li treuen a vostè és cultural o d’hàbits, però la capacitat de tot el que és nou dóna una dimensió a la IA generativa, a la multimodalitat i a mil i una aplicacions que li permet pujar al tren en un moment d’acceleració i popularització determinants.
IBM, Meta i Apple tampoc s’han quedat de braços plegats. Avui ja sembla impossible una setmana sense que cadascuna de les grans tecnològiques mogui peça amb la IA. Seguir comptes a X, directes a YouTube i feeds de mitjans especialitzats genera una mena de vertigen, passió, pessigolleig i estrès. IBM accelera en la cursa per fer els centres de dades més sostenibles amb un invent que redueix cinc vegades el consum energètic d’entrenar la IA. Meta ha llançat el model de text Llama 3.3 70B i suma gairebé 100 milions de nous usuaris de Meta AI l’últim mes. Apple activa ChatGPT gratis amb Siri a l’iPhone perquè la IA d’OpenAI respongui preguntes complexes. iOS 18.2 ja està disponible, de manera que ChatGPT i les funcions més avançades d’Apple Intelligence arriben a l’iPhone.
Acabo sense oblidar esmentar una de les notícies de la setmana des d’un punt de vista estratègic per a Barcelona, Catalunya i Espanya: Brussel·les ha elegit el Barcelona Supercomputing Center per instal·lar una fàbrica d’IA en què Espanya invertirà 62 milions d’euros. Queda pendent per a les pròximes setmanes un perfil i una galàxia dels homes forts de Trump a la nova Casa Blanca, especialment el de David Sacks com a ‘tsar’ de la IA i les criptomonedes. Detecto una presència de continguts informatius sobre IA als mitjans generalistes cada cop més amables i generosos. Digueu-me optimista, però sembla com si el catastrofisme hagués reculat.
OpenAI anuncia un advent nadalenc ambiciós. Vol arribar als 1.000 milions d’usuaris el 2025, introduir anuncis a ChatGPT per competir amb Google i afronta demandes al Canadà per drets d’autor
Malgrat la creixent competència de Google, Microsoft, Meta i altres, l’eina d’OpenAI continua sent la més fiable i innovadora per a 200 milions d’usuaris setmanals
Microsoft presenta una eina a Teams per clonar la teva veu i parlar en altres idiomes. Mistral llança Pixtral Large i millora Le Chat per competir amb ChatGPT
Greg Brockman es reincorpora a OpenAI per ajudar un Sam Altman que intenta acostar-se a l’home del moment, Elon Musk. Donald Trump vol revocar la decisió de Joe Biden de bloquejar TikTok