Chat

elektrotechnik a informatik

Ing. Pavel Matějka

Vystudoval Fakultu elektrotechniky a informatiky na Vysokém učení technickém v Brně. Nyní je postgraduálním studentem na Ústavu radioelektroniky na Fakultě elektrotechniky a komunikačních technologií a na Ústavu počítačové grafiky a multimedií na Fakultě informačních technologií VUT v Brně. V létě 2008 odevzdal svoji dizertační práci na téma „Identifikace jazyků z mluvené řeči“. Od listopadu 2002 do června 2003 byl na stáži v Oregon Graduate Institute of Science and Technology, USA. Aktivně se účastní mnoha projektů zabývajících se zpracováním řeči, účastnil se také mezinárodních soutěží v identifikaci jazyků a mluvčího z mluvené řeči. Mezi jeho výzkumné zájmy patří hlavně rozpoznávání fonémů (nejmenších součástí zvukové stránky řeči, které má rozlišovací funkci), založené na nových technikách extrakce příznaků a neuronových sítích. Více v reportáži Kdopak to mluví? z cyklu PORT.

Záznam chatu ze středy 12. listopadu 2008

evča: „Zdravím, co se vám vybaví, když si vzpomenete na pobyt v USA...něco vtipného? díky“

Ing. Pavel Matějka: „Při pobytu v USA se přihodilo hodně zajímavých věcí, které se nám zdají normální, ale při pohledu z jejich úhlu ne. Např. po víkendu jsme přišli do školy a asi 4metry od vchodových dveří pod břízkou roslo asi tak 40 hříbků (kozáku) různé velikosti. Naše srdce zajasalo, že budeme mít smaženici a pár jsme si jich posbírali. Odpoledne už půl školy vědělo, že jsou tady opět Češi, kteří sbírají hříbky. Druhý den je přejeli všechny sekačkou ....“

Helena K.: „Co je to vlastně "řeč"? Poznali byste, kdyby třeba mluvil nějaký mimozemšťan?“

Ing. Pavel Matějka: „Poznal byste slunečnici, kdybyste nevěděl, že to je slunečnice? Obecně umíme rozpoznávat to co jsme již v minulosti viděli.“

Zdeněk: „Jsou vaše metody k rozpoznávání jazyků podbné těm, které používají v zahraničí? Srovnáváte svoje postupy, nebo je raději držíte v tajnosti?“

Ing. Pavel Matějka: „Svoje výsledky prezentujeme na mezinárodních konferencích, účastníme se srovnávacích soutěží s mezinárodní účastí a spolupracujeme s univerzitami ze zahraničí. Podle výsledků v soutěžích se naše skupina může porovnávat s těmi nejlepšími na světě.“

Jana: „Už vás pane inženýre požádala o pomoc naše policie?“

Ing. Pavel Matějka: „O podobné technologie se obecně zajímají různé bezpečnostní složky.“

Hnz: „Chtě bych se zeptat, jaké principy strojového učení využíváte ve Vašich projektech?“

Ing. Pavel Matějka: „Nejčastěji používáme statistické techniky založené na skrytých Markovových modelech. Pro některé úlohy používáme neuronové sítě nebo support vector machines, případně i jiné.“

Zdeněk: „Dobry den. Rad bych se zeptal, zda rozpoznavani prezentovane v poradu pouziva k analyze PCA, ci podobny princip? A pokud ano, ktere casti signalu jsou brane ke zpracovani. Zda sepktralni analyza, ci neco podobneho? Je mi jasne ze vzorky v case by moc nefungovaly ;-)“

Ing. Pavel Matějka: „Systém který byl použit v pořadu byl založen na analýze spektra řeči. Byla použita i HLDA (Heteroscedastic Linear Discriminant Analysis) jako zobecnení PCA (Principal Component Analysis), ale ta není v systému ta nejdůležitější část. Tou je statistický model spektra řeči (Gaussian mixture model), který byl navíc rozšířen o modelování různých vlivů kanálu.“

Petr: „Myslíte, že byste mi mohl blíže vysvětlit, co je to foném a k čemu je dobrý?“

Ing. Pavel Matějka: „Zjednodušeně je to jedna hláska řeči (dvě slova se musí lišit alespoň v jednom fonému). Například slovo AHOJ má čtyři fonémy a h o j. Při rozpoznávání řeči většinou vytváříme model této základní jednotky a složitější modely (slova) skládáme z nich.“

gympl Praha: „A co řeč zvířat ? Je takový výzkum? Co si o této možnosti myslíte? Děkujeme“

Ing. Pavel Matějka: „Zajisté, takový výzkum existuje, ale my ho neděláme. Otázka je jestli zvuky zvířat máme chápat jako řeč. Minimálně se z nich u některých zvířat dá určit jejich emoční stav, doba říje, zda jsou hladoví, ...“

Vašek: „Poznáte naše politiky podle mluvy? Hezký večer.“

Ing. Pavel Matějka: „Pokud máme jejich nahrávku předem, tak s velkou pravděpodobností ano, ale to neplatí jen o politicích.“

Felix: „Věřím že počítače jsou mocné stroje. Nicméně při jakékoliv digitální modulaci hlasu bude takřka nemožné (i v případě že budu mít několik originálních hlasů k porovnání) zjistit kdo je majitel ? Děkuji“

Ing. Pavel Matějka: „Záleží na konkrétní modulaci a na jakém principu je systém postaven. Systému nevadí některé modulace, jednoduše protože si jich v řečovém signálu vůbec nevšímá (hlasitost, vyška základního tónu, ....), na další modulace existují různé kompenzační techniky. V tomto ohledu je již počítač přesnější než člověk.“

Lukeš P.: „V létě 2008 odevzdal svoji dizertační práci na téma „Identifikace jazyků z mluvené řeči“... Jak Vás to , pane inženýre, napadlo - tento obor? Zdraví“

Ing. Pavel Matějka: „K identifikaci jazyků jsem se poprve dostal na stáži v USA v roce 2003, před tím jsem pracoval na rozpoznávání fonémů. S tím že se účastníme mezinárodních soutěží v tomto oboru, se člověk dostane na různá místa po světě a seznámí se s velice příjemnými lidmi, se kterými pak většinou začne spolupracovat a soutěžit zároveň, čímž to je zajímavější a zajímavější.“

Hnz: „Pokud tedy používáte lineární klasifikátory + neuronové sítě, jak výkoný HW využíváte, aby bylo možné provádět zpracování řeči v reálném čase?“

Ing. Pavel Matějka: „Vždy záleží na aplikaci (rozpoznávání jazyků, mluvčího, pohlaví, fonémů, řeči), pro testování používáme jedno obyčejné PC. Pro trénování systémů je to jiné, tam jich používáme stovky najednou, aby jsme byly schopni takovýto systém natrénovat v krátké době.“

M. Lavičková: „Čím vším se tato škola zabývá - Oregon Graduate Institute of Science and Technology, USA ? Čeho si na americkém školství ceníte a co Vám naiopak nekonvenovalo. Děkuji a přeji hezký večer.“

Ing. Pavel Matějka: „OGI je nyní součástí Oregon Health&Science University. Tato universita má velice široký okruh zájmů: od technických, přes humanitní, po medicínu. Byl jsem tam ve výzkumné laboratoři, takže se školstvím jako takovým jsem nepřišel moc do styku, takže nemohu říci.“

Péťa: „Jaké máte jiné zájmy? Máte jistě dobrý hudební sluch.“

Ing. Pavel Matějka: „Hudební sluch moc nemám, spoléhám že se to naučí počítač. Jsem spíše na vysokohorskou turistiku, lezení, lyže, focení, ....“

L. Landa: „Kolika cizími jazyky se, pane inženýre, domluvíte?Děkuji.“

Ing. Pavel Matějka: „Hlavně čeština a angličtina. Učil jsem se i německy a rusky ale hlava zapomíná.“

J. Mánek: „Co podle Vás přinese digitalizace? V čem by se měla nejvíce pro vývoj společnosti využít? Díky a zdravím.“

Ing. Pavel Matějka: „Digitalizace čeho? Obecně: jednodušší zpracování dat, rychlejší přístup k datům a vyhledávání v nich, přístup k větším archívům.“

o´brien: „V čem všem vlastně soutěžíte na tom mezinárodním poli? A jak?“

Ing. Pavel Matějka: „Naše skupina se zabývá a účastní mezínárodních srovnávacích kampaní v oblastech: rozpoznávání jazyků, řečníků, přepisu řeči, vyhledávání v řečových archívech a detekce klíčových slov v řeči.“

gympl Praha: „Vy asi nemáte žádné zvíře, že? Možná, že to není jen o emocích... Třeba se na to jednou taky přijde.“

Ing. Pavel Matějka: „Také na to věřím. Měl jsem psa a zase mít budu. Není to jen o zvucích ale i o mimice a dalších nepatrných niancích. Snažil jsem se popsat něco, co by věda dokázala realizovat již nyní.“

Hnz: „Velké nadnárodní firmy investují miliony USD do technologii rozpoznávání řeči. Za jak dlouho si myslíte, že budou tyto technologie zralé pro komerční nasazení do přístrojů běžné spotřeby? Velké firmy přece jenom platí lépe než VŠ, nelitujete toho, že jste zůstal na VŠ a nešel pracovat některé z těchto firem?“

Ing. Pavel Matějka: „Některé technologie jsou již nasazené nyní a vydělávají investorům peníze (call centra, zpracování televizních vysílání, automatické řečové přepisy). Na řečových technologiích je zatím stále co zlepšovat, ale určitě se s nimi budeme stýkat stále častěji. Nasazení některých technologii není problém současného stavu vývoje ale ceny. Těžko si někdo koupí k vypínači PC. Zatím nelituji, že jsem zůstal na VŠ, má to své klady i zápory.“

L.K.: „Jak se Vám líbí pořad PORT? Sledujete ho alespoň občas? Zdravím Luděk“

Ing. Pavel Matějka: „Nesleduji, nemám televizi ani doma ani v práci. Raději vyrážím někam do přírody.“

Šulcovi: „Jak Váš výzkum a práce slouží handicapovaným ? Např. ten přepis řeči ... ? Můžete také pomoci neslyšícím ? Děkujeme.“

Ing. Pavel Matějka: „Například pracujeme na projektu automatického přepisu a vyhledávání v přednáškách, který by měl usnadnit přístup k vyukovým materiálům i neslyšícím. Samozřejme budeme rádi pokud se naše technologie k handicapovaným dostanou.“

brouk Pytlík: „Není toto téma trochu spíše pro odborníky ? Laik neví, o čem je řeč.“

Ing. Pavel Matějka: „V pořadu jsme se snažili uvádět co nejvíce příkladů a srovnání ze života, abysme toto téma přiblížili široké veřejnosti.“