2019-08-20

Separace vokální stopy

Pokud jste někdy pocítili potřebu zremixovat (čtěte zprznit ;) cizí nahrávku, tak asi víte, že je potřeba nejprve získat samostatné nesmíchané stopy (tj. zpěv, kytara, basa, bicí, klávesy, atd.). Ty vám obvykle může poskytnout sám interpret (čas od času někdo stopy publikuje pro fanouškovské remixové soutěže) nebo se takové soubory (ze starých soutěží, z bonusových médií, z her typu Rock Band nebo uniklé ze studia) dají najít na specializovaných polopirátských webech, které mívají v názvu termíny jako "Remix Stems", "Remix Packs", "Acapella", "Instrumental" a podobně.

Problém je, pokud se chcete pustit do neoficiálního remixu něčeho, co nikdy nikdo po stopách nezveřejnil, ale i to je dnes do jisté míry řešitelné. =)

Klasický postup

Za starých časů existovalo jediné a nikoliv dokonalé řešení - ekvalizér. =) Kompletní nahrávka se prostě protáhla přes ekvalizér s pásmovou propustí zhruba od 100 Hz po 8 kHz (v horším případě třeba až 200 Hz - 4 kHz - podle vkusu každého soudruha =) a výsledkem byl "telefonní" zvuk bez basů (baskytary a kopáku) a výšek (činely a většina sykavek). Pak se vystříhaly pasáže, kde zpěv vůbec nebyl, a děj se vůle boží.

"Karaoke mode"

S postupem digitalizace a popularizací karaoke se objevily různé "pluginy" pro mp3 přehrávače, které se více či méně úspěšně snažily separovat nebo naopak potlačit zpěv. Většinou také vycházejí z předpokladu, že nejhlasitější části zpěvu (tedy samohlásek, které tvoří tóny) se pohybují zhruba v rozsahu 200 Hz až 4 kHz, a jako pomocné kritérium používají pozici zvuku ve stereo prostoru. Zpěv se tradičně umisťuje do středu mixu (tj. je stejně hlasitý z levého i pravého reproduktoru), takže za zpěv se pak považují ty frekvence, které jsou v daném rozsahu a navíc jsou stejně zastoupeny v levém i pravém kanálu.

U elektronické hudby, kdy jsou jednotlivé takty často na bit stejné, se pak dá použít "odečtení fáze". To znamená, že se do jedné stopy umístí část nahrávky bez zpěvu s převráceným záznamem a do druhé stopy jiná část, kde je stejný hudební doprovod a navíc zpěv. Pokud se obě nahrávky dokonale srovnají a liší se skutečně pouze přidaným zpěvem, tak výsledkem jejich smíchání bude samostatný zpěv. Jak asi tušíte, tak tohle je v praxi málokdy použitelné, protože i v případě, že by byl doprovod zcela stejný, se obvykle celý mix ještě protáhne kompresorem dynamiky, takže se hlasitost doprovodu nějakým způsobem změní, ale někdy je výsledek možné alespoň použít jako základ pro jiné metody.

"Ruční editace frekvenčního spektra"

Dalším vývojovým stupněm byly aplikace typu Spectral Layers (Sony, pak MAGIX, nyní Steinberg), kde má uživatel k dispozici frekvenční mapu zvukového záznamu a může myší přidávat nebo ubírat zastoupení různých frekvencí. Teoreticky je tak možné vyseparovat jakýkoliv zvuk, ale prakticky je to neuvěřitelná piplačka s nejistým výsledkem.

"Umělá inteligence"

Program, který dnes nemá umělou inteligenci, jako by nebyl. =) Zatím jsem se nikdy neodvážil prostudovat celý princip skutečně do hloubky, ale hodně přibližně a zjednodušeně se jedná o metodu, kdy se pomocí FFT získá časově proměnný frekvenční histogram, kterým se pak krmí neuronová síť. Ta by měla být schopna rozpoznat, které frekvence k sobě patří a společně tvoří jeden nástroj nebo hlas.

Většina podobných projektů byla donedávna ve stavu experimentu, ale to se změnilo někdy v roce 2018, kdy se na webu objevila stránka PhonicMind. Tam můžete nahrát libovolnou hudební nahrávku a webová aplikace se jí pokusí rozdělit na vokální stopu a doprovod. Výsledky jsou už poměrné solidní, ale jedná se o komerční projekt, takže se buď dočkáte jen 30 s ukázky nebo musíte za separaci celého záznamu zaplatit pár dolarů a to nepřeje velkým experimentům. =}

Naštěstí byl minulý týden zveřejněn i projekt Open-Unmix. Je skutečně "open", což znamená, že je k dispozici zdarma a počítá se s dalším vývojem a "trénováním" rozpoznávacího modelu, ale bohužel to taky znamená, že k němu zatím neexistuje zrovna uživatelsky přívětivé prostředí.

Pokud chcete projekt zkusit na svém počítači, tak potřebujete stáhnout zdrojáky v Pythonu, nainstalovat distribuci Pythonu Anaconda, naimportovat "prostředí" aplikace (na PC bez VGA s podporou CUDA lze použít soubor "environment-cpu-linux.yml"), doinstalovat modul "pytorch-cpu" (conda install pytorch-cpu torchvision-cpu -c pytorch) a za příznivého počasí si to stáhne natrénovaný model a po několika minutách žvýkání to vygeneruje separované stopy nebo v horším případě chybové hlášení, že vám došla operační paměť. ;) (Při konverzi 4minutové písničky se mi běžně zaplnila celá 8 GB RAM a PC chvílemi přestávalo reagovat.)

Proti PhonicMind jde Open-Unmix ještě o dva kroky dál - jeho výstupem jsou čtyři samostatné stopy (vokály, basa, bicí a zbytek). Výsledky separace jsou logicky lepší u "přehlednějších" nahrávek (folk-rock) a naopak horší u nahrávek se zkresleným zpěvem nebo s neobvyklým nástrojovým obsazením, ale v každém případě to považuji za zatím nejlepší aplikaci tohoto druhu. =)

Pokud nechcete nic instalovat, tak si aplikaci můžete zkusit na virtuálním počítači přes Google Colab (Open in playground, Runtine - Run all), kde je možné jako vstup zadávat i odkazy přímo na hudební videa na YouTube, ale je třeba počítat s tím, že virtuální počítač má své limity a je schopen zpracovat jen kratší úseky. (Při mých testech byla maximální fungující délka záznamu cca 2:20. U delších ukázek se virtuální počítač odpojil.)

2019-08-11

I love how you make mistakes

Po koncertu Khoiby na Colours jsem dostal zlomyslný nápad nějak Khoibu přiblížit současnému mainstreamu a zcela výjimečně jsem to poměrně rychle realizoval. Je tam všechno (přehnaný kick, umělé tleskání, buildup, drop s kvílivým vokálním samplem a dokonce i autotune), ale přesto mám dojem, že to stále není dostatečně mainstreamové a rádia by to nehrála ani pod nátlakem. Těžko říct, jestli to je výchozím materiálem nebo je problém ve zpracování, ale pořád to nezní dost optimisticky a asi se s tím nedá nic dělat... Melancholie je tam prostě hluboce zažraná. =}

(Titulní obrázek jsem chtěl původně udělat ve stylu některého obalu Nicki Minaj (Anaconda nebo Chun-Li), ale nakonec mi to připadalo fakt moc a dost jsem ubral. =)

2019-08-09

Colours 2019 - den první

Příliš aktuální reportáže jsou nebezpečné v tom, že by si je mohlo přečíst větší množství lidí, a tak mám tradičně velké zpoždění... =}

Po loňském výpadku jsem se letos znovu dostavil na Colours. Nejsem už schopen spočítat, kolika ročníků jsem se jako divák zúčastnil (12? 13?), ale tenhle ročník byl velmi specifický v tom, že jsem se ho proprvé pokusil zúčastnit s malými dětmi, což s sebou nevyhnutelně neslo různé logistické problémy a programová omezení.

Druhé úskalí představoval letmý pohled do programu. To, že se na českých festivalech pravidelně opakují čeští interpreti, je celkem očekávatelné, ale zdá se, že Colours dosáhly kritického stáří, kdy se významně začínají opakovat i zahraniční hosté. To se samozřejmě stávalo i dříve (například Goran Bregović 2003 a 2007), ale letos se mi tenhle trend zdál obzvlášť výrazný: Mogwai (2012), Mariza (2005), ZAZ (2012 a 2014), Ólafur Arnalds (2014 a s Kiasmos 2016), (2014), Kronos Quartet (2012), Pierce Brothers a pravděpodobně i další. Těžko říct, jestli je možné s tím něco udělat, když si Zlata Holušová stěžuje na rostoucí finanční požadavky zahraničních účinkujících.

Z hlediska organizace ovšem všechno klapalo a dovnitř jsme se dostali celkem rychle a hladce, takže jsme z dálky zaslechli ještě část oficiálního zahájení. Za normálních okolností bych se pravděpodobně alespoň chvilku podíval na Buty, abych zkontroloval, kolik Radek Pastrňák od minule přibral, ale tentokrát bylo nutné zahájit program v dětském koutku.

Cestou jsme se chvíli zdrželi v takzvaném YouTube stanu kde probíhal takzvaný workshop Tanec západní Afriky. Výuku jsme už zřejmě nestihli, protože program spočíval v tom, že na pódiu se čtyři vystupující (jeden černošský pár a dvě bělošky) s různými bubny snažili se střídavými úspěchy držet rytmus a na provizorní dřevěné (nečekaný luxus!) podlaze před pódiem k tomu poměrně neorganizovaně trsala věkově pestrá skupina bosých žen. Jako obutý muž jsem se tam nevyhnutelně cítil trochu nemístně. =}

V dětském koutku se děti vrhly na dřevěné prolézačky a já jsem si koupil první kelímek limonády pro homosexuály.

Trochu mě překvapilo, když se z velkého stanu začaly ozývat ne-zcela-dokonalé coververze českých i světových hitů (Mirai, Queen, Barbora Poláková, ...), protože mi nebylo úplně jasné, proč něco takového hraje právě v dětském koutku, takže jsem nahlédl dovnitř a na pódiu objevil převážně dětskou skupinu Docela. Tím pádem jsem své hodnocení musel přehodnotit, protože z pohledu poměru kvality a věkového průměru to bylo skvělé. =)

Za pomoci jednoho kornoutu zmrzliny se mi povedlo dostat na začátek koncertu post-hudby. Vzhledem k odpolednímu času koncert nevyhnutelně postrádal atmosféru, kterou dokáže dodat jen tma a přemnozí světelní efektové, ale i tak byl začátek mnohem civilnější, než by bylo žádoucí, protože jsem si zpočátku nebyl jistý, jestli se už jedná o první track nebo ještě o závěr zvukové zkoušky. ;)

Za dobu, kdy měla post-hudba tvůrčí pauzu, oba pánové trochu změnili image a zvlášť Dominik Zezula vypadal v šiltovce skutečně málo alternativně. ;) Když zmínil, že zvukař je před vystoupením uvítal hodnocením "DJ a rapper", tak se skutečně nebylo čemu divit - až na to, že to byl takový oslí můstek k tomu, aby pak Zezula vylovil akustickou kytaru a místo elektronického písničkářství post-hudby se z pódia rázem ozývalo spíše klasičtější písničkářství ve stylu Zezulovy bokovky (?) Děti mezi reprákama.

Většinu koncertu tvořily (zřejmě) písničky z letošního alba, které jsem ještě neslyšel, a připadalo, že nejvýraznější rozdíl proti starším nahrávkám je to, že přibylo dvojhlasého zpěvu. Zatímco Zezula své litánie tradičně podával spíše polohlasem, tak Tomáš Havlen to jako "sbor" bral pěkně od podlahy. Jedinou výjimkou byly tuším Skořápky, kdy Zezula znenadání začal zpíval naplno a zaskočil zvukaře v nedbalkách, protože v tu chvíli zcela přehlušil cokoliv, co se z pódia mělo ozývat. V závěru koncert vůbec nějak přidával na síle a při posledním tracku jsem si připadal spíše jako na koncertu WWW (aka Neurobeat). =)

Jako správná alternativa samozřejmě post-hudba odradila většinu náhodných posluchačů a později jsem se samozřejmě dozvěděl, že "Ghost of You byli mnohem lepší a dalo se to normálně poslouchat". ;)

Dále jsem měl v programu zatrženou , protože minule jsem jí dost odbyl a chtěl jsem jí tentokrát dát druhou šanci, ale nehudební vlivy způsobily, že jsem se ocitl u Fresh Stage, kde na scéně postával Yemi a jeho taneční skupina a ze všech sil se snažili zapojit publikum do všemožných hudebně-tanečních aktivit. Nějak takhle si pamatuju organizovanou zábavu na mimoškolních akcích a to včetně rozpačitých výsledků: publikum rozdělené na několik sekcí beatboxu příliš nezvládalo složitější rytmy a jediný odvážlivec, který byl pozvaný na pódium něco - cokoliv - zazpívat, se zasekl v půlce refrénu písně Jožin z bažin. O něco lépe snad vypadal tanec, ale o tuhle část jsem kvůli svým povinnostem WC asistenta nezletilých přišel. Pokud měla být pointou závěrečná Yemiho věta "každý může být tvůrčí", tak tenhle pódiový experiment ji v mých očích moc nepodpořil.

Slibnější bylo akustické Kalle na Full Moon scéně. Začalo to dobře a o něco poklidněji, než jsem čekal (takový obývákový koncert) a úplně stejně dobře to pokračovalo, až jsem usoudil, že raději zkusím prozkoumat i jiné scény. Cestou jsem ještě zaslechl zasvěcený komentář nějaké paní, že "obě ty desky jsou stejné", ale to určitě nemluvila o Kalle...

Minimal techno a přidružené žánry mě moc nebaví, ale Richie Hawtin a.k.a. Plastikman je celkem známé jméno, tak jsem se odhodlal k přesunu na scénu NHKG/ISPAT/Mittal Steel/ArcelorMittal/Liberty. Vizuálně mě docela zaujalo minimalistické (no jo, minimal! =) osvětlení scény, která byla zalitá umělou mlhou a ostře nasvícena zezadu od podlahy pódia, takže Hawtin a stohy jeho elektronického vybavení se rýsoval jen jako neurčitá tmavá silueta proti bílému pozadí. Hudebně mě zaujaly žánrově poměrně neobvyklé změny tempa, které ovšem u taneční hudby nejsou příliš žádoucí, a ... no to bylo vlastně všechno. Publikum bylo rozprostřené ve tmě na veliké ploše a všechno to působilo dost chladně. Bloudil jsem tmou zase jinam.

Ve stanu, který se dříve jmenoval "Electronic Stage" a letos "YouTube Stage" (WTF?!), dýdžejoval pro mně v podstatě neznámý Francouz Étienne de Crécy. Hudba byla minimálně o 20 % harmoničtější a optimističtější než u Hawtina a solidně zaplněný stan spokojeně tancoval, takže mě nevyhnutelně napadla otázka, čím si vlastně Hawtin zasloužil větší scénu...?

Nutně jsem ovšem musel vidět Nèro Scartch, protože mě zajímalo, jestli už si od minulé účasti na Colours (2016-4) všichni účastníci ujasnili, jestli jsou skupina nebo sólový projekt Jakuba Svobody. Odpovědi jsem dočkal poměrně brzy ("Kdo viděl můj poslední klip?"), ale i tak mi zůstala spousta nezodpovězených otázek, kam tenhle projekt směřuje a co chce vlastně sdělit (nějak se mi vybavili Southpaw), protože Svoboda mi jako frontman připadal nepřesvědčivý a občas až nechtěně směšný (promluvy mezi písničkami!) a to se mi u Trenta Reznora nestává. Na druhou stanu jsem to tentokrát vydržel až do konce, takže úplně beznadějné to nebylo. ;)

Pak začala na vedlejší scéně konečně ta pravá elektronická alternativa a koncert "pro pět lidí". To je samozřejmě trochu nadsázka, ale na hlavní scéně na druhé straně areálu už začala Florence & The Machine, takže publikum na ba:sel bylo značně prořídlé. Popis v oficiálních materiálech byl celkem výstižný, ale pro sebe jsem si přidal charakteristiku "něco mezi Björk a post-hudbou", přičemž hlavní rozdíl proti Björk byl klidnější zpěv.

Ba:sel jsou přímo archetypální dvoučlenná skupina: muž + žena, rozum + cit, elektronika + akustika, jin + jang a současně představují praktické dopady globalizace na pražskou hudební scénu. =) Mlčící Čech Daniel Vlček trávil převážnou část svého pobytu na pódiu tím, že si rukou přehraboval lehce přerostlé vlasy, ale kromě toho tam taky něčím kroutil a trochu ve stylu Petera Hooka vybrnkával na baskytaře. Ewelina Chiu ("Polka s čínskými kořeny vychovaná v Severní Americe") byla skutečně mírně šikmooká a kromě zpěvu hrála na klávesy (čili piano) a občas i na příčnou flétnu, což myslím není hudební nástroj, který by byl v posledních letech příliš v kurzu, ale já ho mám zvukově docela rád. Ewelina mě ale nejvíc překvapila svou češtinou, protože na rozdíl od většiny Poláků zvládala český přízvuk na první slabice a slabiny má zřejmě jen v gramatice. =)

Na Florence & The Machine jsem se zastavil cestou domů spíše z pocitu, že si musím udělat čárku, takže jsem se z velké dálky jen ujistil, že všechno funguje. Pódium ovládala chytrá horákyně oblečená do starší záclony, kapela hrála, sboristky zpívaly a zvuk byl v pořádku, takže jsem mohl v klidu zamířit na noční autobus a vyhnout se tak ušlapání po konci koncertu.