Současné komunikační technologie kódují a přenášejí ženský hlas hůře než ten mužský | Ilustrace: DALL-E 3

Ilustrace: DALL-E 3

Současné komunikační technologie kódují a přenášejí ženský hlas hůře než ten mužský

Tým českých vědců pod vedením profesora Jana Holuba z Fakulty elektrotechnické ČVUT v praxi ověřil, že mnohé komunikační technologie přenášejí ženský hlas hůře než ten mužský. Výsledkem zkoumání je technická zpráva Evropského ústavu pro telekomunikační normy ETSI (PDF, přílohy).

Člověkem vnímaná kvalita přenosu a kódování hlasu se měří na standardní škále MOS (mean opinion score) podobně jako ve škole, ale obráceně. Skóre 1 tedy odpovídá nízké kvalitě a skóre 5 naopak té excelentní. Pokud se zavádí nové technologie, rozhodují řádově desetiny: „0,5 je už poměrně velký rozdíl,“ doplňuje Holub.

Podle zjištění profesora Holuba, Kateřiny Helisové a Yanna Kowalczuka se reálná kvalita ženského hlasu přenášeného současnými technologiemi snižuje oproti tomu mužskému zhruba o desetinu, což tedy rozhodně není málo.

Ženský hlas má vyšší frekvence a to je problém

Důvody, proč tomu tam tak je, jsou podle vědců prosté a dlouhodobě známé zvláště u úzkopásmového spojení a amplitudové modulace (AM), která se dodnes používá třeba v letecké dopravě.

bec61f29-ca72-49e7-9891-0c21ed98b5c6
Profesor Jan Holub prezentuje výsledky výzkumu

Pro úzkopásmové frekvenční pásmo je typické, že průměrně znějící ženský hlas, který má výše položený základní tón a celá jeho energie je ve spektru výš, je frekvenčně oříznut. Takže informace se technicky přenáší hůře než v případě hlubších mužských hlasů. Tam se to ale kompenzuje tím, že úzkopásmové přenosy bývají v zarušeném prostředí, které pro změnu zamaskuje mužské hlasy ležící v obdobném spektru jako ruch,” popisuje profesor Holub.

Moderní širokopásmové technologie už sice podobným ořezem netrpí, ženský hlas ale opět v mnoha případech přenášejí v kvalitě.

„Důvody, proč ten rozdíl vzniká, jsou celkem známé. Je to vždy kompromis mezi nějakým novým kritériem a tím, kolik dat je třeba přenést za uskutečněný hovor,“ nastínil Holub.

Potřebujeme lepší kodeky

„Jedno z kritérií při návrhu moderního číslicového kodéru je délka rámce. Řečový signál se rozdělí na části, které se překrývají. Čím jsou rámce kratší, tím jich je – za minutu či sekundu – více.

Čím jsou delší, tím je jich méně. Pokud se každý tento úsek zakóduje přes knihovnu okamžitých spekter do konečného počtu bitů, tak ve finále, čím je úsek delší neboli paketizace řidší, tím méně dat se přenáší,” popsal vědec postup.

To má podle jeho slov vliv i na úspory v přenosové síti, když je třeba část přenosové trasy pronajatá. „Právě tím, že je ženský hlas ve spektru položen výše, tak je spousta detailů v daném časovém průběhu zrychlená. Tudíž čím větší rámce se zvolí, tím hůře se to kóduje, neboť kodér uvnitř rámce předpokládá, že jde o kvazi-stacionální signál. Rychlé změny tam nedokáže dobře zachytit,“ doplnil expert.

Prvním krokem pro zlepšení je podle něj využívat kratší rámce. „Což má bohužel přímý důsledek v navýšení potřebné přenosové rychlosti. Nebo obráceně, když jsou návrháři nuceni, aby se vešli do dané přenosové rychlosti, tak jedna z možností je navrhnout dostatečnou délku řečového rámce. To je známá věc,“ sdělil prof. Holub.

Nebyl to záměr inženýrů, ale historický vývoj 

„Dále jsou tu frekvenční filtry, které se na trase vyskytují. Mají za cíl omezit šumy mimo řečové spektrum. Tyto filtry jsou historicky navrhovány tak, že mohou potlačit vyšší frekvenční složky – včetně části spektra ženského hlasu.

To je snadno opravitelná věc, ale s paketizací je to horší, protože to prostě něco stojí,“ dodal vědec. Zdůraznil, že požadavek na snížení statisticky významného rozdílu mezi přenosem průměrného mužského a ženského hlasu je oprávněný.

Ženský hlas podle jeho slov nebyl upozaděn záměrně. „Ta paketizace se prostě historicky vyvíjela od úzkopásmového spojení, kde rámce byly ještě delší nebo ještě hůře kódované, a zatím se to nedoladilo,“ poznamenal profesor Holub.

V praxi se aktuální stav může projevovat třeba tak, že se zprávy diktované ženským hlasem po radiolince musí zopakovat víckrát a komunikace zabere více času.

Určitě si přečtěte

Články odjinud