Videotéka Prime Video umožní rychle nalezení libovolné scény
Streamingová služba Amazone Prime Video umožní pomocí hlasového vyhledávání okamžitě přeskočení uživateli přímo k momentu, o který má zájem. Novinka je prozatím k dispozici pouze na zařízeních s podporou Fire TV.
S hlasovým vyhledáváním scén začíná Prime Video u Fire TV. Foto: Amazon
V praxi vše funguje tak, že stačí hlasový asistent Alexa+ požádat o přeskočení k filmové scéně podle herce, postavy či citátu, například „Přeskoč k romantické scéně u dveří ve filmu Láska nabeská“ nebo „K honičce s obří koulí v Jezdcích ztracené archy“. Funkce rozpozná film i bez uvedení názvu pomocí vizuálního porozumění, titulků a technologie X-Ray. Novinka funguje jak pro předplatitele, tak samostatně zakoupení filmy.
Aktuálně implementovaná funkce je postavena na technologii Amazon Bedrock s podporou modelů Amazon Nova a Anthropic Claude. Funkce pokrývá tisíce filmových titulů s desítkami tisíc indexovaných scén a chystá se její rozšíření. Alexa+ slouží jako chytrý asistent napříč službami Amazonu. Rozšiřuje tak personalizovaná doporučení a objevování obsahu rychleji podle preferencí uživatelů.
Prime Video zároveň nasadila novou funkci Video Recaps, která používá umělou inteligenci k vytváření shrnutí děje nejdůležitějších dějových bodů v podobě videa s divadelní kvalitou. Služba je k dispozici v beta verzi v USA. Video Recaps kombinují synchronizaci samotného děje, úryvky dialogů a hudbu, aby vytvořily vizuální shrnutí, které připraví diváky na novou sezonu. Funkce staví na vydání X-Ray Recaps z roku 2024, což je AI funkce, která vytváří shrnutí bez spoilerů v textové formě. Gérard Medioni, viceprezident technologií v Prime Video, zdůraznil, že Video Recaps představuje průkopnickou aplikaci generativní AI pro streamování.
Proces vytváření Video Recaps zahrnuje více kroků. Generativní AI analyzuje klíčové dějové body a postavy sezony, aby porozuměla nejdůležitějším momentům, které budou stěžejní pro diváky vstupující do nové sezony. Umělá inteligence poté najde nejemotivnější části a spáruje je s audio složkou, úryvky dialogu a hudbou. Všechny prvky jsou poté spolu kombinovány do finální podoby videa opatřené případně i hlasem vypravěče.
-lukpol-