Řekněte to svému počítači...

Historická reklama firmy RCA Victor s pejskem Napperem, který "poznal hlas svého pána" dostává v počítačové éře nový význam. Počítačům lze diktovat a zvukový záznam řeči je automaticky převáděn na psaný text. Nové technologie umožňují výrazně usnadnit jednu z otravných rutinních činností, která je však nezbytná v řadě oborů - diktování a přepisování. A to už s úspěchem i v češtině.

 

V roce 2003 zahájila nově vzniklá firma Newton Dictate projekt rozpoznávání hlasu. Jeho cílem bylo implementovat rozpoznávání plynulé řeči do procesu doslovného přepisu televizních a rozhlasových pořadů. Po 10 letech je výsledkem této aktivity rozsáhlý program software pro rozpoznávání řeči, který na rozdíl od konkurenčních produktů tohoto typu si poradí i s češtinou, která je jinak pro systémy voice recognition umožňující funkci diktátu (tzn. převodu mluvené řeči na počítačový textový záznam) skutečně těžkým oříškem.

Učenlivý systém

Na rozvoji hlasových technologií úzce spolupracuje firma s týmem prof. Jana Nouzy z Technické univerzity v Liberci. Letos uvedla na trh novou verzi Newton Dictate 3.2, která je ještě přesnější a rychlejší než dosavadní úspěšné produkty a nabízí vylepšenou podporu v operačním systému Windows 8.
Hlavní novinkou je inteligentní systém automatické hlasové adaptace, který se sám průběžně učí rozpoznávat hlas diktujícího. Uživatel má k dispozici možnost volby mezi průběžnou a jednorázovou formou automatické adaptace. Po zaškrtnutí příslušné volby se tak bude přesnost přepisu diktátů daného uživatele postupně stále zlepšovat. Příjemnou inovací nové verze programu je i funkce nastavení rychlosti přepisu, která přináší možnost zrychlení převodu do textu na méně výkonných počítačích. Vzhledem k tomu, že aplikace vyžaduje pro plné nasazení poměrně výkonnou konfiguraci, jde o skutečně užitečné vylepšení.
Přehledný systém nastavení hlasových povelů je jednodušší na ovládání, nově byl přidán hlasový příkaz pro uložení audio záznamu. Opět další praktická maličkost, která však výrazně zlepšuje komfort uživatele. Rozšířená nabídka multimediálních souborů pro offline přepis umožní převést na text nahrávky formátu MP3, WAV, WMA, AMR, AVI, MP4, MP2, MOV, 3GP, SPX a DSS.
Inovovaná knihovna pro správu externích zařízení poskytuje v nové verzi také lepší podporu pro mikrofony, nožní pedály a další periferie. Díky plné kompatibilitě se všemi formáty DSS a DS2 je tak možné efektivně diktovat s diktafony Philips a Olympus (včetně práce s multifunkčními mikrofony Olympus).

Rozumí právníkům, ekonomům i farářům
S obecným slovníkem lze diktovat běžné texty, ale při používání odborné terminologie už je nutná větší specializace. K tomu slouží doplňkové moduly v podobě odborných slovníků, které znají i slova a fráze obvyklé pro daný obor a umožňují tak diktovat specializované texty. Podle výrobce zvládá program rozpoznávání jednotlivých slov a větných spojení z rozsáhlých slovníků obsahujících řádově stovky tisíc slov, a to od libovolného mluvčího a v reálném čase s úspěšností přes 98 %. Speciální slovníky zahrnují terminologii z různých oblastí jako jsou např. advokacie, daňové poradenství či ekonomika, slovníky pro státní správu a úřady, početnou sérii slovníků z řady medicínských oborů, ale opční výbava Newton dictate zahrnuje dokonce i modul církevního či policejního slovníku.

 

 
Publikováno: 25. 8. 2013 | Počet zobrazení: 1409 článek mě zaujal 257
Zaujal Vás tento článek?
Ano