Setmana espectacular: Runway, ElevenLabs, Suno, Claude i la veu de ChatGPT ens fan volar

Act-One de Runway + Voice Design de ElevenLabs + Dream Lab de Canva + Claude 3.5 Sonnet + Suno i Timbaland + ChatGPT amb veu + Notebook LM de Google + Gemini Live + Copilot a WhatsApp

Setmana espectacular: Runway, ElevenLabs, Suno, Claude i la veu de ChatGPT ens fan volar
Imatge generada amb Midjourney per Saül Gordillo.

Durant una altra setmana frenètica en el món de la intel·ligència artificial, hem vist com la tecnologia continua transformant diversos sectors a una velocitat impressionant. Runway ha llançat Act-One, una nova funció de captura de moviment d'expressió facial amb intel·ligència artificial, dissenyada per crear animacions realistes. Al mateix temps, ElevenLabs ha presentat Voice Design, que permet als usuaris crear una veu personalitzada a partir d'un missatge de text. Canva també s'ha sumat a les innovacions amb Dream Lab, una eina que utilitza la tecnologia del model Phoenix de Leonardo AI per permetre a qualsevol persona crear imatges. En el sector musical, Suno s'ha aliat amb l'artista Timbaland, una col·laboració que promet transformar el paradigma de la música, segons Paréntesis MEDia. El nou senzill de l'artista estarà disponible perquè els seus seguidors facin 'remixes' utilitzant IA generativa.

Claude, la IA d'Anthropic que ha superat ChatGPT, ha actualitzat el model Claude 3.5 Sonnet, capaç de controlar el teu ordinador per si mateix. Aquesta setmana també ha arribat a Europa el model de veu avançat de ChatGPT, disponible tant per a usuaris de pagament com gratuïts. Simplement has de començar un nou xat o reiniciar l'aplicació d'OpenAI i clicar en una icona de so al costat del micròfon en la caixa on escrius el missatge de text per conversar amb ChatGPT. Pots triar una veu entre diverses opcions 'masculines' i 'femenines'. Aquesta innovació revolucionarà la manera de relacionar-se amb el chatbot, donant un pas molt important i 'humanitzant' l''assistent personal' d'IA. Pots parlar en qualsevol llengua, de manera que OpenAI ha avançat amb l'espanyol, català, gallec i euskera al famós ChatGPT públic i obert que ens va prometre Pedro Sánchez per aquest any.

Altres avenços d'aquesta setmana en la IA en espanyol inclouen l'opció de Notebook LM de Google de generar podcasts i resums d'àudio a partir de textos i documents en castellà. Fins ara, aquesta opció només era possible en anglès. Aquesta setmana també disposem de l'opció en espanyol de Gemini Live i podem incorporar la IA de Microsoft Copilot al nostre WhatsApp. A Paréntesis MEDia expliquen com fer-ho en un minut.

És espectacular! En el nostre anterior butlletí Algoritme Transparent titulàvem que la IA generativa de vídeo i àudio accelerava amb Adobe, Suno i Notebook LM. En aquesta edició hauríem de titular que l'acceleració supera tots els límits de velocitat permesos. Teniu deures per al cap de setmana. Act-One de Runway + Voice Design d'ElevenLabs + Dream Lab de Canva + Claude 3.5 Sonnet d'Anthropic + Suno i Timbaland + ChatGPT amb veu avançada + Notebook LM de Google + Gemini Live + Copilot en WhatsApp = Diversió assegurada. Podreu passar hores i hores i veureu com la vostra curiositat, experiència d'usuari, productivitat i creativitat es dispara per 1.000 amb les novetats d'aquesta mateixa setmana. Som conscients de la velocitat i competitivitat entre empreses que això està prenent tot? La IA generativa va com un coet mentre que els aparells amb IA estan arribant a final d'any molt eclipsats. Durant els últims mesos hem assistit al fracàs dels dispositius AI Pin de Humane i Rabbit R1, i aquesta setmana ens arriben notícies que Apple frena la producció de les seves ulleres de realitat augmentada Vision Pro. Aquest 2024 serà, entre moltes altres coses, l'any de les aplicacions i serveis d'IA davant la decepció dels dispositius.

Si voleu acabar l'any estant al dia de la IA, subscriviu-vos gratuïtament a Paréntesis MEDia i a Algoritme Transparent si encara no esteu registrats amb el vostre correu electrònic. I recomaneu aquests butlletins, un diari i aquest setmanal, per enganxar-vos a tots els progressos en IA i tecnologia que estan marcant el nostre present i el de les empreses i institucions.

Imatge generada amb Midjourney per Saül Gordillo.

A continuació, una selecció de les notícies que més m'han interessat de la setmana i la meva entrega trenta-cinquena de la sèrie IA per a tothom al diari El Punt Avui.

Eleccions Estats Units

( ) Paréntesis MEDia

OpenAI

Microsoft

Google

Perplexity

Anthropic

Eines

Curiositats

Mitjans

La sèrie IA per a tothom d’El Punt Avui

La trenta-cinquena entrega de la sèrie IA per a tothom d’El Punt Avui:

La IA sacseja la campanya presidencial: Kamala Harris i Donald Trump són objectius d’atacs amb hipertrucatge (deepfakes) en una cursa electoral ajustada. La IA complica la verificació de fets i afegeix nous reptes en la lluita contra la desinformació.

Helen Toner, artífex de la pugna a OpenAI: Exmembre de la junta d’OpenAI, és clau en els debats sobre la regulació de la IA, tot i perdre la seva batalla contra Sam Altman.

Eines destacades:

  • Ministraux, amb potencial per transformar sectors com la robòtica
  • Música personalitzada creada a partir de vídeos i fotos

Breus:

  • Galtea, ‘spin-off’ del BSC per a IA generativa
  • Meta preveu més acomiadaments i aposta per la IA
  • Repsol millora la productivitat amb IA generativa
  • Èxit a Girona de la 17a edició de la Catosfera

Consulta tota la sèrie IA per a tothom a la web. I els PDF del diari imprès.

[Article originàriament publicat a Algoritmo Transparente.]

Algoritme Transparent #55

Articles relacionats

Estigues al dia. Subscriu-te al butlletí