Sora, Gemini 2.0 i el xip quàntic Willow: la IA tanca el 2024 transformant la tecnologia

IBM accelera la sostenibilitat en centres de dades, Meta llança Llama 3.3 amb 100 milions d’usuaris, Apple integra ChatGPT gratuït amb Siri i Brussel·les tria Barcelona per a la seva primera fàbrica d’IA

Sora, Gemini 2.0 i el xip quàntic Willow: la IA tanca el 2024 transformant la tecnologia
Imatge generada amb Grok 2 per Saül Gordillo.

Poques setmanes tan productives com aquesta en el món de la Intel·ligència Artificial. Abans d’acabar el 2024, Google i OpenAI han protagonitzat una sèrie d’anuncis rellevants, però IBM, Meta, xAI i Apple tampoc s’han quedat de braços plegats. Arribem a final d’any amb la sensació d’una democratització de la IA generativa com mai abans, amb Sora ja disponible per a tots els usuaris premium de ChatGPT, excepte per als europeus i ciutadans d’algunes dictadures. Els usuaris de l’esperada eina de generació de vídeo d’OpenAI —una llarga espera durant la qual han sorgit alternatives realment competitives— han detectat que Sora no és tan bona com mostraven les demostracions de fa uns mesos, tant en els moviments com en les imatges hiperrealistes. Caldrà veure si és una censura buscada per OpenAI per complir amb la legislació o si realment es tracta d’una limitació de l’eina. Sora incorpora marques d’aigua visibles, metadades integrades per a la traçabilitat i prohibicions estrictes contra la generació de contingut amb drets d’autor, representacions de menors i material explícit.

L’arribada de Sora al gran públic després de setmanes i mesos d’avantatge dels seus competidors posa de manifest un aspecte que semblava superat amb la IA generativa en altres formats: la importància del ‘prompting’. Semblava que l’habilitat a l’hora de donar instruccions o saber iterar era cada vegada menys rellevant, però quan es tracta de generar vídeo, amb Sora, Gen-3 Alpha de Runway o Tencent de Hunyuan Video, entre d’altres, l’encert de qui utilitza aquestes IA amb ordres textuals és molt rellevant. Ja arribarà el moment en què sigui facilíssim generar vídeo de qualitat o espectacularitat amb poc esforç o professionalitat. El vídeo va darrere del text i la imatge. Amb Sora, es popularitzaran els clips i, malgrat les restriccions per evitar deepfakes, assistirem a un boom del vídeo amb IA pròximament. Sora arriba deu mesos tard, amb el fre de mà posat per part d’OpenAI i amb l’exclusió de la Unió Europea i altres països poc exemplars, però la capacitat de marcar tendència de la companyia de Sam Altman és fora de dubte. Només cal veure la campanya de màrqueting que han fet amb el calendari d’advent nadalenc i els regals-anuncis d’OpenAI que cada nit ens tenen tots pendents dels seus directes.

Google ha donat un cop sobre la taula aquesta setmana. Ha presentat Willow, un xip quàntic que resol en 5 minuts una tasca que abans ocuparia quatrilions d’anys a un superordinador. També ha presentat Trillium, un xip potent per a la seva IA Gemini 2.0, que afegeix funcions multimodals i desafia els seus competidors. Google fa un pas important en l’era dels agents d’IA. Gemini 2.0 vol jugar la partida. Google també ha convertit el projecte Jarvis en Mariner i ha fet de Jules el salvavides autèntic per als programadors. El que ha fet aquesta setmana la companyia de Sundar Pichai és molt important. Pichai ha advertit de canvis rellevants en el cercador de Google a partir de principis del 2025. Així que venen corbes.

Si vostè, apreciat lector, és un dels afortunats amb una subscripció a Algoritme Transparent i fins ara vivia allunyat de l’actualitat de la IA, sap que arriba en el millor moment. Aquesta setmana és un punt d’inflexió per Sora, per les presentacions de Google, pel llançament d’OpenAI d’un ChatGPT Pro a 200 dòlars mensuals com a IA de raonament bestial, productiu i robust, però també per tot un seguit de novetats d’altres actors tecnològics i per les expectatives del segon mandat de Donald Trump a la Casa Blanca i la influència sobre Javier Milei i per la influència d’Elon Musk, que només n’hi ha un.

Musk deu ser lector d’Algoritme Transparent perquè si la setmana passada dèiem que Grok dins de X (antic Twitter) és una integració atractiva i estimulant, ara acaba d’anunciar que serà gratuïta. L’eina de generació d’imatge de Grok, amb resultats hiperrealistes sense censura i un punt punk, ja és perceptible a la xarxa social X, marcant un nou escenari i contribuint a un imaginari de la IA més alliberador. Estimat lector, prengui nota de tot el que passa i no dubti a provar aplicacions i eines perquè té la sort d’arribar en el moment oportú i de no haver-se perdut res tan rellevant dels dos últims anys: ara això va de debò tant com a usuari com en el món de l’empresa. L’avantatge que alguns li treuen a vostè és cultural o d’hàbits, però la capacitat de tot el que és nou dóna una dimensió a la IA generativa, a la multimodalitat i a mil i una aplicacions que li permet pujar al tren en un moment d’acceleració i popularització determinants.

IBM, Meta i Apple tampoc s’han quedat de braços plegats. Avui ja sembla impossible una setmana sense que cadascuna de les grans tecnològiques mogui peça amb la IA. Seguir comptes a X, directes a YouTube i feeds de mitjans especialitzats genera una mena de vertigen, passió, pessigolleig i estrès. IBM accelera en la cursa per fer els centres de dades més sostenibles amb un invent que redueix cinc vegades el consum energètic d’entrenar la IA. Meta ha llançat el model de text Llama 3.3 70B i suma gairebé 100 milions de nous usuaris de Meta AI l’últim mes. Apple activa ChatGPT gratis amb Siri a l’iPhone perquè la IA d’OpenAI respongui preguntes complexes. iOS 18.2 ja està disponible, de manera que ChatGPT i les funcions més avançades d’Apple Intelligence arriben a l’iPhone.

Acabo sense oblidar esmentar una de les notícies de la setmana des d’un punt de vista estratègic per a Barcelona, Catalunya i Espanya: Brussel·les ha elegit el Barcelona Supercomputing Center per instal·lar una fàbrica d’IA en què Espanya invertirà 62 milions d’euros. Queda pendent per a les pròximes setmanes un perfil i una galàxia dels homes forts de Trump a la nova Casa Blanca, especialment el de David Sacks com a ‘tsar’ de la IA i les criptomonedes. Detecto una presència de continguts informatius sobre IA als mitjans generalistes cada cop més amables i generosos. Digueu-me optimista, però sembla com si el catastrofisme hagués reculat.

Google

OpenAI

Elon Musk

Meta

Apple

BSC

IBM

Microsoft

Estats Units

Curiositats

La serie IA para todos de El Punt Avui

La quaranta-dosena entrega de la sèrie IA per a tothom d’El Punt Avui:


Musk reforça X i desafia ChatGPT amb Grok

  • Grok 2 arriba a X com una eina d’IA trencadora, sense autocensura i plena de controvèrsies.
  • OpenAI llança ChatGPT Pro amb els models o1 i 4o, els més avançats fins ara, per 200 dòlars mensuals.

Carme Torras: IA, ètica i robòtica al servei de la societat

  • Pionera en IA i reconeguda amb la Creu de Sant Jordi 2024. Una trajectòria brillant en ciència i literatura.

Eines destacades

  • Hunyuan Video: Tencent revoluciona amb vídeos oberts.
  • Nova: Amazon llança la seva família d’IA multimodals.
  • Veo: Google permet crear vídeos directament des de text.
  • Justicio: Una IA que resol dubtes legals.

Actualitat

  • Meta aposta per un cable submarí global.
  • Gemini transforma l’assistent de Google.
  • Apple col·labora amb Amazon per liderar en IA.
  • Paréntesis.MEDia celebra un any d’IA amb èxit

Consulta tota la sèrie a la web. I els PDF del diari imprès.

[Article d’Algoritmo Transparente #62 també traduït a l’espanyol, anglès, francèsi italià.]

Articles relacionats

Estigues al dia. Subscriu-te al butlletí