SpeechTech s.r.o.

  • Zvětšit velikost písma
  • Výchozí velikost písma
  • Zmenšit velikost písma
Home Produkty Syntéza řeči (SpeechTech TTS)

SpeechTech TTS - syntéza řeči

Základem rodiny produktů TTS je vlastní TTS engine se sadou vlastních umělých hlasů. Aplikace TTS vždy sestává ze dvou hlavních částí - TTS engine a hlasu. Verze těchto částí použitá v produktu určuje kvalitu výsledného syntetického hlasu i náročnost produktu na výpočetní výkon.

V současné době provozujeme TTS enginy označované 2.6, 2.9 a 2.10. Kvalita syntézy všech verzí TTS enginů je rozdílná. Verze 2.6 je rychlá, ale nižší kvality. Verze 2.9 a 2.10 jsou srovnatelné vyšší kvality, ale nová verze 2.10 je významně rychlejší. Obdobně je tomu i u hlasů. Zde je kvalita určena jak rozsahem a kvalitou původních nahrávek, tak i mírou následného "postprocesingu" a "čištění" nahrávek.

České hlasy

jméno hlasu [jazyk] Verze syntézy stáhněte si kvalita hlasu
Alena [CZ] 2.6
Alena [CZ] 2.10
Iva [CZ] 2.10
Jan [CZ] 2.6
Jan [CZ] 2.10
Radka [CZ] 2.10
Stanislav [CZ] 2.10
Tomáš [CZ] 2.6

Slovenské hlasy

jméno hlasu [jazyk] Verze syntézy stáhněte si kvalita hlasu
Melánie [SK] 2.6
Melánie [SK] 2.10

Anglické hlasy Cereproc

Autorem těchto dvou hlasů je firma CereProc Ltd ze Skotska. Další informace o této firmě naleznete na jejích stránkách www.cereproc.comCereProc logo

jméno hlasu [jazyk] Verze syntézy stáhněte si kvalita hlasu
Cereproc Sarah [EN]
Cereproc William [EN]

Pozn. hvězdičky u jmen zjednodušeně hodnotí kvalitu syntetického hlasu.

Všechny hlasy můžete vyzkoušet v našem online DEMU.

Software je platformě nezávislý a podporuje tyto platformy:

  • Intel, Windows (2K, XP, 2003, Vista, 7), 32 bitů
  • Intel, Windows (2003, Vista, 7), 64 bitů - jako 32 bitové knihovny
  • Linux, 32 bitů
  • Linux, 64 bitů

Zakázková syntéza textů

Na základě Vaší objednávky Vám můžeme profesionálně zkonvertovat Váš text do audio souboru. Součástí této služby je i namátková kontrola zkonvertované řeči a příprava zadaného textu. Zadaný text se nejprve poloautomaticky zkontroluje a případné neznámé zkratky či nevhodné části textu se upraví tak, aby je bylo možné lépe přečíst. Výsledný text je zkonvertován do MP3 či do jiného požadovaného formátu.

Služba se hodí například pro příležitostné využití TTS bez nutnosti pořizovat nákladnou licenci TTS a školit personál na použití nového programu. Je to vhodné například pro úlohy ozvučení prezentací, dokumentárních filmů, syntézu textů na webové stránky, jednorázové vygenerování audio nahrávek pro ozvučení Vašeho programu apod. Základní cena je určena za 1 normostranu textu, v případě většího počtu stran Vám rádi nabídneme množstevní slevu.

Online TTS

Syntéza textů přes proprietární asynchronní XML-RPC/http rozhraní. Vhodné pro telefonní systémy či webové aplikace bez požadavků na generování v reálném čase. Možno snadno využít z různých programovacích jazyků a frameworků, např. z PHP, Pythonu, C/C++, Javascript, Flash atd. Licencování Online TTS je za množství syntetizovaných dat. Pro nabídku nás prosím kontaktujte.

TTS Server

Pro partnery – vhodné pro těsnou integraci do produktů partnerů přes proprietární nízkoúrovňové API (Linux, Windows). Pro co nejtěsnější integraci do Vašeho produktu.

Rozhlasový systém s TTS

Samostatný modul TTS je možné velmi pohodlně použít pro rozhlasová hlášení ve veřejných prostorách nebo pro personalizovaná hlášení vyvolávacího systému. Forma implementace je závislá na technologii zákazníka – prosím kontaktuje nás pro podrobnosti. Licencování je závislé na počtu lokací, kde je systém provozován.

TTS pro mobilní a embedded zařízení

Pro zařízení s malým výkonem nabízíme SpeechTech TTS verze 2.6, které je výkonově vhodné pro taková zařízení. TTS poskytujeme pouze partnerům pro integraci do vlastních produktů. Produkt se licencuje formou platby za každé zařízení nebo formou revenue-share. Jsme schopni dodat knihovnu pro mobilní telefony Apple IPhone.

TTS hlas na přání

Na přání zákazníka je možné vytvořit TTS se speciálním hlasem, např. hlasem vybraného mluvčího organizace - za podmínky, že mluvčí namluví řečovou databázi – namlouvá se několik týdnů po několika hodinách denně. Řeší se formou projektu - doba tvorby a dodání hlasu je zhruba 6 měsíců.
Též je možno zvýšit přirozenost počítačové TTS tzv. doménově orientovanou TTS, pro kterou je třeba pořídit nahrávky nejčastějších vět a frází, které se mají vyskytovat během provozu. Tato možnost umožňuje ještě zvýšit přirozenost řeči běžně dodávaného hlasu pro speciální užití zákazníka.

Licencování

Podle způsobu nasazení nabízíme:

  • licence na 1 využívaný komunikační kanál pro IVR systémy
  • licence na geografickou lokalitu pro rozhlasové systémy
  • licence na instalaci TTS knihovny bez možnosti dalšího šíření vygenerovaných dat
  • licence na distribuci vygenerovaného audia počítané dle vygenerovaných dat

Vlastnosti

  • Vstupem může být neformátovaný text, pro využití všech možností SpeechTech TTS doporučujeme použít standard W3C SSML (Speech Synthesis Markup Language).
  • Podporované platformy:
    - Linux i Windows (XP/server 2003/7 PRO/server 2008), 32bit i 64bit architektura.
    - Jednoduché API pro snadnou integraci z jazyků: C, C++, C# (Visual Studio), Java (JNative), Python (ctypes)
    a dalších.
    - Distribuce formou DLL / SO knihovny.
    - Možnost kompilace pro embedded platformy (na dotaz).
    - Podpora protokolu MRCP v rámci produktu SpeechTech MRCP server