La Intel·ligència Artificial fa un nou salt a l’inici d’un 2024 vertiginós de la mà d’OpenAI

El llançament de l’aplicació Sora per crear a l’instant vídeos amb una simple frase és un cop sobre la taula de la companyia de ChatGPT que eclipsa l’última novetat de Google, Gemini 1.5

La Intel·ligència Artificial fa un nou salt a l’inici d’un 2024 vertiginós de la mà d’OpenAI
Intel·ligència Artificial OpenAI Sora video

El 15 de febrer quedarà marcat en la història recent de la Intel·ligència Artificial. Google llança aquest dia, dijous, Gemini 1.5, que properament estarà disponible per al gran públic, amb una finestra de context d'1 milió de tokens per a aquells que paguin, i prometent deixar en ridícul a GPT-4 d'OpenAI. Aquesta és la primera actualització del seu model d'IA d'última generació, una setmana després de la ‘defunció’ de Bard i de l'Assistent de Google, del reanomenament a Gemini i de la sortida de Gemini Ultra 1.0. Gemini 1.5 Pro (Google) oferirà una finestra de context de 128.000 tokens, la mateixa que GPT-4 Turbo (OpenAI), però hi haurà una varietat de preus fins a arribar al milió de tokens. Google explica que amb aquest milió Gemini 1.5 Pro pot processar sobre la marxa "1 hora de vídeo, 11 d'hores d'àudio i bases de codi amb 300.000 línies de codi o més de 700.000 paraules". La companyia assegura haver experimentat durant la investigació amb fins a 10 milions de tokens, imagineu-vos.

Google llança Gemini 1.5 i destrossa a OpenAI i GPT-4, va titular Hipertextual. Era la notícia del dia i de la setmana. Potser la del primer mes i mig de l'any. O la notícia del primer trimestre de 2024. Doncs bé. El mateix dia, 15 de febrer, OpenAI i, dos minuts després Sam Altman, anuncien a Twitter (X) el llançament de Sora, una aplicació que permet generar en segons vídeos d'un minut amb una simple instrucció escrita. La web d'OpenAI porta alguns vídeos de Sora, que és com es diu aquesta nova aplicació de ‘text-to-video’. Greg Brockman i, al cap d'una estona, Mira Murati també tuitegen, però Sam Altman comença a penjar els vídeos que Sora generava a partir de les peticions escrites que els seus seguidors a Twitter li anaven llançant.

OpenAI respon de cop a l'envit de Google amb Gemini 1.5 i de Nvidia amb Chat with RTX anunciant el llançament de l'aplicació que completa la seva santíssima Trinitat: text (GPT), imatge (DALL·E) i vídeo (SORA).

L'impacte a les xarxes socials de l'aparició de Sora és encara aquest cap de setmana espectacular, fins al punt que fins i tot els mitjans de comunicació tradicionals, tan reticents a aquestes novetats, ho converteixen en notícia. De cop, el gran públic ha sabut d'una nova prestació que tindrà OpenAI, la companyia creadora de ChatGPT, de tal manera que estarem davant el que algú ha descrit com la santíssima Trinitat: GPT per a text, DALL·E per a imatge, i SORA per a vídeo. Ningú dubta que l'àudio, més fàcil que la imatge i el vídeo, està a caure, encara que paradoxalment sobre ell pot pesar la hipocresia o el puritanisme imperant. A l'àudio no se li pot posar una marca d'aigua.

El món mundial, doncs, sap que qualsevol persona podrà generar vídeo en instants escrivint una simple frase. I que aquest vídeo pot ser tan realista que sembli la gravació d'una escena real. El món mundial, que no s'havia assabentat de la notícia del llançament de Gemini 1.5, per a desesperació de Google, té un atac de vertigen novament de la mà d'OpenAI i de Sam Altman. A Google, últimament tot se li ennuega amb la companyia de ChatGPT. No només pel producte sinó també per la comunicació. Gemini 1.5 ha quedat eclipsat per Sora el mateix 15 de febrer, aquest passat dijous, als mitjans de comunicació tradicionals, digitals i especialitzats. Però, el que és pitjor, OpenAI ha guanyat novament la partida a Google en l'impacte emocional a les xarxes socials entre el públic més fan de la IA.

L'ocupació del ‘time-line’ a Twitter i YouTube dels vídeos de Sora en detriment de l'anunci de Gemini 1.5 és la victòria de David contra Goliat com a marca de la casa de la IA.

El festival de tuits i vídeos d'Altman i els seus, la ràpida reacció de divulgadors com Carlos Santana, Jon Hernández i Xavier Mitjana detallant i comentant Sora. L'ocupació del nostre ‘time-line’ a Twitter i YouTube dels vídeos de Sora en detriment de l'anunci de Gemini 1.5 és, al meu entendre, la victòria de David contra Goliat com a marca de la casa de la Intel·ligència Artificial. Les regles del joc han canviat, i la sensació d'impotència o frustració que van experimentar aquest dijous a Google deuen ser indescriptibles.

Una organització sense ànim de lucre fundada al desembre de 2015 per Ilya Sutskever, Greg Brockman, Trevor Blackwell, Andrej Karpathy, Sam Altman i Elon Musk, aquests eren els membres inicials de la junta, està passant la mà per la cara a Google. (Per cert, també li passa la cara per la mà a Elon Musk, que va deixar la seva participació a OpenAI. I, per cert bis, aquesta setmana Andrej Karpathy ha anunciat que també sortia de la companyia per dedicar-se a projectes personals. Caldrà investigar els moviments interns i recuperar mini-sèries.)

L’intent de ‘troleig’ de Zuckerberg, la devolució de les Vision Pro i l’empenta de Nvidia

Dijous jo patia perquè al meu bloc de notes tenia anotades algunes notícies i novetats per comentar-vos aquí, a Algoritme Transparent. Tenia un material pobre per escriure un butlletí que pogués interessar al gran públic i als més interessats en la IA. El retorn de les primeres Vision Pro, les ulleres de realitat virtual d'Apple que van sortir a la venda el 2 de febrer als Estats Units, per part d'alguns compradors. L'aparició d'unes ulleres de pasta amb IA que costen un 10% dels 3.500 dòlars de les Vision Pro. Que Mark Zuckerberg se’n fot de les Vision Pro i pretén augmentar les vendes de les Quest 3 de la seva Meta aprofitant el ‘hype’ de les ulleres d'Apple. Que ChatGPT tindrà memòria i recordarà les nostres converses anteriors amb ell. Que OpenAI vol plantar cara a Google amb un cercador propi. Que Midjourney estrena web i facilita el seu ús entre el gran públic fora de l'entorn de Discord. Que als Estats Units han decidit que la IA no pot patentar invents. Que la ciutat de Nova York ha demandat a les cinc grans xarxes socials per perjudicar la salut mental dels seus joves. Que una parella es casa gràcies a que la IA els ha ajudat a superar les seves barreres idiomàtiques. Que Nvidia ha superat a Amazon en valoració de mercat. Que Sam Altman busca una quantitat de diners ingent per fabricar-se els xips i no dependre precisament de Nvidia. Que Joe Biden s'ha estrenat a TikTok en any electoral malgrat les pròpies advertències per la (in)seguretat d'aquesta xarxa per part de la seva administració. Que a Espanya hi ha algun espavilat que està acumulant premis en concursos de cartells municipals gràcies a la IA. O que als fans d'Estopa no els ha fet gràcia la imatge d'una cançó generada amb IA (el cartell, no la música).

Amb aquests mimbres m'havia d'espavilar per portar-vos aquesta setmana un nou Algoritme Transparent a l'alçada de les expectatives (que no són poques, i moltes gràcies als nous subscriptors!). Però el duel Google-OpenAI i el gran Sam Altman m'han solucionat el problema i tret d'un apur. Portem 40 dies de 2024 i Sora és un cop sobre la taula de la Intel·ligència Artificial. El que està per venir justifica seguir llegint Algoritme Transparent, compartir-lo i recomanar-lo a les vostres amistats o contactes professionals. Aquí repassem el millor i més rellevant. I ho expliquem perquè ho puguin entendre fins i tot aquelles persones que encara no han escrit un ‘prompt’. Fins la setmana que ve!

[La Inteligencia Artificial da un nuevo salto en el inicio de un 2024 vertiginoso de la mano de OpenAI, publicat a Algoritmo Transparente]

Articles relacionats

Acabarem aquest apassionant any 2023...

Amb cinc dits a Midjourney i estirant fils a Threads, amb l’optimisme de Bill Gates i el ‘nou’ Sam Altman responsable, en una Europa que s’agrada regulant

Estigues al dia. Subscriu-te al butlletí