La Intel·ligència Artificial fa un nou salt a l’inici d’un 2024 vertiginós de la mà d’OpenAI
El llançament de l’aplicació Sora per crear a l’instant vídeos amb una simple frase és un cop sobre la taula de la companyia de ChatGPT que eclipsa l’última novetat de Google, Gemini 1.5
Intel·ligència Artificial OpenAI Sora video
El 15 de febrer quedarà marcat en la història recent de la Intel·ligència Artificial. Google llança aquest dia, dijous, Gemini 1.5, que properament estarà disponible per al gran públic, amb una finestra de context d'1 milió de tokens per a aquells que paguin, i prometent deixar en ridícul a GPT-4 d'OpenAI. Aquesta és la primera actualització del seu model d'IA d'última generació, una setmana després de la ‘defunció’ de Bard i de l'Assistent de Google, del reanomenament a Gemini i de la sortida de Gemini Ultra 1.0. Gemini 1.5 Pro (Google) oferirà una finestra de context de 128.000 tokens, la mateixa que GPT-4 Turbo (OpenAI), però hi haurà una varietat de preus fins a arribar al milió de tokens. Google explica que amb aquest milió Gemini 1.5 Pro pot processar sobre la marxa "1 hora de vídeo, 11 d'hores d'àudio i bases de codi amb 300.000 línies de codi o més de 700.000 paraules". La companyia assegura haver experimentat durant la investigació amb fins a 10 milions de tokens, imagineu-vos.
Google llança Gemini 1.5 i destrossa a OpenAI i GPT-4, va titular Hipertextual. Era la notícia del dia i de la setmana. Potser la del primer mes i mig de l'any. O la notícia del primer trimestre de 2024. Doncs bé. El mateix dia, 15 de febrer, OpenAI i, dos minuts després Sam Altman, anuncien a Twitter (X) el llançament de Sora, una aplicació que permet generar en segons vídeos d'un minut amb una simple instrucció escrita. La web d'OpenAI porta alguns vídeos de Sora, que és com es diu aquesta nova aplicació de ‘text-to-video’. Greg Brockman i, al cap d'una estona, Mira Murati també tuitegen, però Sam Altman comença a penjar els vídeos que Sora generava a partir de les peticions escrites que els seus seguidors a Twitter li anaven llançant.
OpenAI respon de cop a l'envit de Google amb Gemini 1.5 i de Nvidia amb Chat with RTX anunciant el llançament de l'aplicació que completa la seva santíssima Trinitat: text (GPT), imatge (DALL·E) i vídeo (SORA).
L'impacte a les xarxes socials de l'aparició de Sora és encara aquest cap de setmana espectacular, fins al punt que fins i tot els mitjans de comunicació tradicionals, tan reticents a aquestes novetats, ho converteixen en notícia. De cop, el gran públic ha sabut d'una nova prestació que tindrà OpenAI, la companyia creadora de ChatGPT, de tal manera que estarem davant el que algú ha descrit com la santíssima Trinitat: GPT per a text, DALL·E per a imatge, i SORA per a vídeo. Ningú dubta que l'àudio, més fàcil que la imatge i el vídeo, està a caure, encara que paradoxalment sobre ell pot pesar la hipocresia o el puritanisme imperant. A l'àudio no se li pot posar una marca d'aigua.
El món mundial, doncs, sap que qualsevol persona podrà generar vídeo en instants escrivint una simple frase. I que aquest vídeo pot ser tan realista que sembli la gravació d'una escena real. El món mundial, que no s'havia assabentat de la notícia del llançament de Gemini 1.5, per a desesperació de Google, té un atac de vertigen novament de la mà d'OpenAI i de Sam Altman. A Google, últimament tot se li ennuega amb la companyia de ChatGPT. No només pel producte sinó també per la comunicació. Gemini 1.5 ha quedat eclipsat per Sora el mateix 15 de febrer, aquest passat dijous, als mitjans de comunicació tradicionals, digitals i especialitzats. Però, el que és pitjor, OpenAI ha guanyat novament la partida a Google en l'impacte emocional a les xarxes socials entre el públic més fan de la IA.
L'ocupació del ‘time-line’ a Twitter i YouTube dels vídeos de Sora en detriment de l'anunci de Gemini 1.5 és la victòria de David contra Goliat com a marca de la casa de la IA.
El festival de tuits i vídeos d'Altman i els seus, la ràpida reacció de divulgadors com Carlos Santana, Jon Hernández i Xavier Mitjana detallant i comentant Sora. L'ocupació del nostre ‘time-line’ a Twitter i YouTube dels vídeos de Sora en detriment de l'anunci de Gemini 1.5 és, al meu entendre, la victòria de David contra Goliat com a marca de la casa de la Intel·ligència Artificial. Les regles del joc han canviat, i la sensació d'impotència o frustració que van experimentar aquest dijous a Google deuen ser indescriptibles.
L’intent de ‘troleig’ de Zuckerberg, la devolució de les Vision Pro i l’empenta de Nvidia
Dijous jo patia perquè al meu bloc de notes tenia anotades algunes notícies i novetats per comentar-vos aquí, a Algoritme Transparent. Tenia un material pobre per escriure un butlletí que pogués interessar al gran públic i als més interessats en la IA. El retorn de les primeres Vision Pro, les ulleres de realitat virtual d'Apple que van sortir a la venda el 2 de febrer als Estats Units, per part d'alguns compradors. L'aparició d'unes ulleres de pasta amb IA que costen un 10% dels 3.500 dòlars de les Vision Pro. Que Mark Zuckerberg se’n fot de les Vision Pro i pretén augmentar les vendes de les Quest 3 de la seva Meta aprofitant el ‘hype’ de les ulleres d'Apple. Que ChatGPT tindrà memòria i recordarà les nostres converses anteriors amb ell. Que OpenAI vol plantar cara a Google amb un cercador propi. Que Midjourney estrena web i facilita el seu ús entre el gran públic fora de l'entorn de Discord. Que als Estats Units han decidit que la IA no pot patentar invents. Que la ciutat de Nova York ha demandat a les cinc grans xarxes socials per perjudicar la salut mental dels seus joves. Que una parella es casa gràcies a que la IA els ha ajudat a superar les seves barreres idiomàtiques. Que Nvidia ha superat a Amazon en valoració de mercat. Que Sam Altman busca una quantitat de diners ingent per fabricar-se els xips i no dependre precisament de Nvidia. Que Joe Biden s'ha estrenat a TikTok en any electoral malgrat les pròpies advertències per la (in)seguretat d'aquesta xarxa per part de la seva administració. Que a Espanya hi ha algun espavilat que està acumulant premis en concursos de cartells municipals gràcies a la IA. O que als fans d'Estopa no els ha fet gràcia la imatge d'una cançó generada amb IA (el cartell, no la música).
Amb aquests mimbres m'havia d'espavilar per portar-vos aquesta setmana un nou Algoritme Transparent a l'alçada de les expectatives (que no són poques, i moltes gràcies als nous subscriptors!). Però el duel Google-OpenAI i el gran Sam Altman m'han solucionat el problema i tret d'un apur. Portem 40 dies de 2024 i Sora és un cop sobre la taula de la Intel·ligència Artificial. El que està per venir justifica seguir llegint Algoritme Transparent, compartir-lo i recomanar-lo a les vostres amistats o contactes professionals. Aquí repassem el millor i més rellevant. I ho expliquem perquè ho puguin entendre fins i tot aquelles persones que encara no han escrit un ‘prompt’. Fins la setmana que ve!
Apple gaudeix del llançament de les seves ulleres de realitat virtual Vision Pro, i Google es juga tota la seva aposta d’Intel·ligència Artificial amb Gemini (Bard ja és història, la primera necrològica d’una IA)
Bona setmana per a Google, pessigolles a Apple amb les Vision Pro, ensurt a Microsoft per Taylor Swift, revés italià per a OpenAI i gener ‘horribilis’ d’Elon Musk. Si vas al cinema, també veus IA
Una setmana aparentment tranquil·la amb llançaments, novetats i integracions d’Intel·ligència Artificial i sense catastrofisme sobre acomiadaments ni el final de la humanitat
Apple continua assistint a la fuga de talent directiu a les portes del llançament de les Vision Pro, i barreja fracassos (front a Microsoft) i èxits (front a Samsung)
Tot tipus de trastos, cotxes, televisors, dispositius i tecnologies amb IA s’han presentat en una setmana de moviments per part d’OpenAI i el sorpasso borsari de Microsoft sobre Apple
Microsoft situa una vicepresidenta seva a la junta directiva de l’empresa de ChatGPT per evitar-se nous ensurts i garantir que Sam Altman i el desenvolupament de la Intel·ligència Artificial no s’aturin
Confessions d’un viatge personal i periodístic per desmitificar la IA i apropar-la a totes les generacions. També el meu resum de la setmana amb OpenAI, Apple, Google, Microsoft, Threads i X.
L’última setmana del 2023 està marcada per la demanda del NYT a OpenAI i Microsoft. Volíem salvar la democràcia o preferim que proliferin els Groks anti-wokes d’Elon Musk?
Amb cinc dits a Midjourney i estirant fils a Threads, amb l’optimisme de Bill Gates i el ‘nou’ Sam Altman responsable, en una Europa que s’agrada regulant