
Naše výzkumná skupina se zaměřuje na inteligentní zpracování textových a obrazových dat s využitím pokročilých metod hlubokého učení. Zvláštní pozornost věnujeme vícejazyčnosti a multimodalitě – schopnosti modelů integrovat a vyhodnocovat informace napříč různými datovými formáty, jako jsou např. text, obraz nebo struktura dokumentu. Cílem naší práce je zefektivnit analýzu rozsáhlých textových dat, automatizovat rutinní úkony spojené s porozuměním dokumentům a vytvářet nástroje, které pomáhají lidem i institucím pracovat s informacemi rychleji, přesněji a v širších souvislostech.
Naše výzkumné aktivity se soustředí zejména do následujících klíčových oblastí:
Klasifikace a kategorizace dokumentů
Vyvíjíme modely schopné automaticky rozpoznat a zařadit dokumenty podle jejich obsahu, struktury nebo účelu. Ať už jde o právní texty, podnikové dokumenty, záznamy z výzkumu nebo zprávy z médií, naše systémy umí rychle vyhodnotit, o jaký typ dokumentu se jedná, a přiřadit mu odpovídající štítek nebo kategorii. To výrazně usnadňuje archivaci, vyhledávání i další automatizované zpracování.
Analýza sentimentu a postojů
Zaměřujeme se na automatické rozpoznávání emocí, názorů a postojů v přirozeném jazyce – v recenzích, diskuzích, médiích nebo interní komunikaci. Naše modely dokáží vyhodnotit, zda je text pozitivní, negativní, neutrální, a zda vyjadřuje určitou míru důvěry, nespokojenosti nebo sarkasmu. Vedle celkového sentimentu se věnujeme také identifikaci a hodnocení jednotlivých aspektů obsahu, tj. konkrétních vlastností, k nimž se hodnocení vztahuje. Tyto nástroje nacházejí uplatnění například v oblasti zákaznické podpory, veřejného mínění nebo krizového řízení značky.
Zpracování historických dokumentů
Spojujeme jazykové technologie, počítačové vidění a hluboké učení s cílem usnadnit přístup k historickým dokumentům. Zaměřujeme se na komplexní zpracování naskenovaných tištěných i rukopisných materiálů – od segmentace stránky a OCR až po přepis a obsahovou analýzu. Vyvíjíme nástroje pro tvorbu automatických souhrnů i vícejazyčné sémantické vyhledávání, které zohledňují dobový kontext a jazyková specifika.
Analýza dokumentů v oblasti medicíny
Zvláštní důraz klademe na zpracování dat z lékařské oblasti, která jsou často neformální, neúplná a silně doménově specifická. Vyvíjíme metody pro extrakci klíčových informací z klinických zpráv, automatickou klasifikaci diagnóz a výkonů, nebo třídění dokumentace podle typu a závažnosti. Výsledkem jsou nástroje, které mohou lékařům, výzkumníkům i pojišťovnám pomoci rychleji se orientovat ve velkém množství dat, aniž by byla ohrožena citlivost nebo etika práce s nimi.
Použité technologie
V naší práci využíváme pokročilé transformerové architektury (např. BERT, RoBERTa) i nejmodernější velké jazykové modely (např. LLaMA, Mistral) pro porozumění a generování přirozeného jazyka. Pro úlohy zahrnující vizuální dokumenty zapojujeme také metody počítačového vidění, včetně vizuálně-textových modelů jako LayoutLM, Donut nebo CLIP, které umožňují multimodální zpracování textu a obrazu současně. Vytváříme vlastní pipeline přizpůsobené konkrétním jazykům i doménovým datům (např. historickým či lékařským dokumentům). Klademe důraz na efektivní nasazení našeho řešení v reálném prostředí.
Podrobné informace jsou k dispozici na stránkách naší výzkumné skupiny.