Tvorcovia ChatGPT predstavili novinku, ktorá generuje videá. Výsledky ťa ohromia
- Spoločnosť OpenAI uviedla nový model generatívnej AI
- Sora dokáže vytvárať realistické videá trvajúce až 60 sekúnd
- Spoločnosť OpenAI uviedla nový model generatívnej AI
- Sora dokáže vytvárať realistické videá trvajúce až 60 sekúnd
OpenAI, popredný hráč v oblasti umelej inteligencie, predstavila nový AI model s japonským názvom Sora, čo v preklade znamená „obloha“, ktorý vytvára „realistické“ a „imaginatívne“ videá trvajúce až 60 sekúnd pomocou krátkych textových promptov.
Ako sa uvádza v blogovom príspevku, Sora zvláda vygenerovať scény s viacerými postavami, špecifickým typom pohybov a detailne spracovaným pozadím. „Model je schopný pochopiť, čo bolo od neho vo výzve požadované, a zároveň ako tieto prvky existujú v reálnom svete.“
„Učíme AI chápať a simulovať fyzický svet v pohybe s cieľom trénovať modely, ktoré pomáhajú ľuďom riešiť problémy vyžadujúce interakciu v reálnom svete,“ píše sa v príspevku.
Personalizovaný obsah
Medzi prvotné ukážky patrilo video vytvorené na základe príkazu: „Filmový trailer zobrazujúci dobrodružstvá 30-ročného vesmírneho muža s červenou vlnenou motocyklovou prilbou, modrá obloha, soľná púšť, filmový štýl, záber na 35 mm film, živé farby,“ uvádza The Guardian.
OpenAI odmietla zverejniť konkrétne informácie o tom, ako prebiehalo trénovanie nového modelu. Je to pravdepodobne kvôli tomu, že si chce zachovať konkurenčnú výhodu. Spoločnosť však bola niekoľkokrát žalovaná za používanie materiálu chráneného autorskými právami pri školení svojich generatívnych nástrojov AI.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI tiež uviedla, že Sora je stále vo vývoji s jasnými „slabými stránkami“, najmä čo sa týka priestorových detailov. Nový model zatiaľ nie je prístupný širokej verejnosti, keďže v súčasnosti prebieha vyhodnotenie potenciálnych hrozieb spojených s jej používaním.
Nová technológia je zdieľaná len s obmedzenou skupinou akademikov a externých výskumníkov na posúdenie možných rizík. Prístup dostali aj vizuálni umelci, dizajnéri a filmári za účelom získania spätnej väzby o možnostiach jej využitia v kreatívnom odvetví.
Reece Hayden, senior analytik z ABI Research pre CNN uviedol, že modely umelej inteligencie tohto druhu by mohli významne ovplyvniť trh digitálnej zábavy tým, že prinesú nový personalizovaný obsah, ktorý bude dostupný prostredníctvom streamingových kanálov.
„Jeden zjavný prípad použitia je v rámci TV; vytváranie krátkych scén na podporu príbehov,“ povedal Hayden. „Model je však stále obmedzený, ale ukazuje smerovanie trhu.“
Potencionálne riziká
DALL-E, Midjourney a ďalšie nástroje na generovanie statických obrázkov dosiahli za posledné mesiace úroveň, o ktorej sa mnohým ani len nesnívalo. Tieto modely sa zdokonalili natoľko, že sú schopné generovať obrázky, ktoré len ťažko rozoznať od skutočných fotografií. Pokrok v oblasti AI však komplikuje rozpoznávanie dezinformácií na internete. Mnoho digitálnych umelcov sa tiež vyjadrilo, že majú problém s hľadaním práce.
„Všetci sme si robili žarty v roku 2022, keď sa Midjourney objavilo po prvý raz a povedali sme si, že je to roztomilé,“ hovorí pre The New York Times Reid Southen, tvorca filmových konceptov z Michiganu. „No dnes ľudia pre Midjourney prichádzajú o prácu.“
Aký dopad budú mať nové generatívne video nástroje, či už na trh práce alebo šírenie dezinformácií, zostáva nateraz otázne. OpenAI síce tvrdí, že videá budú označené vodoznakmi, ktoré ich identifikujú ako generované AI, avšak súčasne priznáva, že tieto vodoznaky sa dajú z videí odstrániť alebo môžu byť ťažko rozpoznateľné.
Zdroje: The Guardian, CNN, The New York Times