10. 02. 2022
Průmysl 4.0 Vysoké školy

rozhovor s inženýrem Janem Švecem z katedry kybernetiky Západočeské Univerzity v Plzni k iniciativě automatického zpracování archivů orální historie a hledání nového projektového partnera v rámci ERDV

Vážený pane inženýre,


můžete nám prosím představit Vaši iniciativu automatického zpracování archivů orální historie? Jaké cíle si v rámci Vašich aktivit kladete a na jakou cílovou skupinu se zaměřujete?


Dobrý den,
naše snaha má své kořeny v projektu NSF MALACH (Multilingual Access to Large Spoken Archives), jehož jsme se počátkem tisíciletí účastnili. Cílem projektu bylo aplikovat metody automatického rozpoznávání řeči na archivy orální historie, v tomto konkrétním projektu na archiv USC Shoah Foundation obsahující výpovědí lidí, kteří přežili Holocaust. V tomto projektu jsme se zaměřili na rozpoznávání češtiny, slovenštiny a ruštiny. V následujících projektech podpořených především českými poskytovali jsme vytvořili především uživatelské rozhraní pro snadné vyhledávání v archivech, stejně jako jsme dále rozšířili paletu podporovaných jazyků především o angličtinu. Ukázka automaticky zpracovaných nahrávek z YouTube kanálu USC Shoah Foundation v angličtině je dostupná na adrese https://malach.kky.zcu.cz/ .
Naše metody se snažíme přizpůsobit komunitě historiků a badatelů, kteří mohou používat především fulltextové vyhledávání konkrétních slov a frází, například jmen nebo geografických názvů. Zároveň jednoduché uživatelské rozhraní podporuje širokou laickou veřejnost v procházení archivní materiálů a případném vyhledávání materiálů souvisejících například s jejich rodným městem.

 

Můžete nám blíže přiblížit, jak Vaše platforma pro automatické zpracování a indexaci nahrávek funguje a kde všude je možné Vámi vyvinuté technologie využít.


Naše platforma nabízí plně automatizované zpracování nahrávek. Na vstupu máme nahrávky opatřené metadaty, která jsou použita při vyhledevání a zobrazení v uživatelském rozhraní. Tyto nahrávky jsou automaticky zkonvertovány do jednotného formátu, je z nich získána audiostopa, ta je následně rozpoznána do textu. Rozpoznaný text je zaindexován v databázi a zároveň je použit pro automatické vygenerování titulků. Nakonec jsou nahrávky automaticky zařazeny ke zobrazení a vyhledávání v uživatelském rozhraní.
V rámci projektů podpořených českým Ministerstvem kultury jsme zároveň obohatili naší platformu o možnost zobrazení a automatického zpracování skenovaných strojopisných dokumentů, vznikl tak Digitální archiv dokumentů NKVD/KGB k československé historii (https://archivkgb.zcu.cz/). Zároveň dokážeme v rámci jednoho uživatelského rozhraní prezentovat výpovědi z archivů orální historie spolu s doplňujícími materiály, např. skeny vyšetřovacích spisů nebo fotografiemi.


Je možné rozšířit Vaše aktivity také do německy mluvících zemí a zahrnout také partnery z Evropského regionu Dunaj-Vltava do Vašich budoucích záměrů?


Automatické zpracování nahrávek vyžaduje mít dostupné modely pro automatické rozpoznávání řeči v daném jazyce. Jak jsem již zmiňoval, v současnosti máme plně integrovány modely pro češtinu, slovenštinu a angličtinu. Němčina se nám jeví jako směr, kam bychom mohli cílit s našimi aktivitami. Hledáme proto i možné partnery, kteří by měli zájem o automatizované zpracovávání archivů orální historie, ať již v německém jazyce nebo i vícejazyčné.


Kontakt:
Jan Švec
NTIS - New Technologies for Information Society
University of West Bohemia
E-mail: honzas@ntis.zcu.cz
Tel. +420 377 63 2557

 

Internet:
Katedra kybernetiky, Fakulta aplikovaných věd Západočeské univerzity v Plzni, http://www.kky.zcu.cz/en
Výzkumné centrum NTIS, Fakulta aplikovaných věd Západočeské univerzity v Plzni, https://www.ntis.zcu.cz/en/Research/Speech-and-image-technology/Speech-technology/index.html

Foto: Ukázka interaktivního vyhledávání prostřednictvím uživatelského rozhraní. (zdroj J. Švec)


Zpět
Mapa
Letní brigády v ERDV

Letní brigády v ERDV

Získejte zkušenosti

Archiv článků
Ikona

Poznej Evropský region

28 barokních kulturních pokladů

28 barokních kulturních pokladů

28 barokních kulturních pokladů

Místní poklady

Místní poklady

Tradice, kterou nelze uložit do muzea

Videoprezentace některých vysokých škol

Videoprezentace některých vysokých škol

Studenti ukazují, co je populární Vysoké školy v regionu tří zemí nyní také v obraze a zvuku

Série podcastů o zdravotní péči

Série podcastů o zdravotní péči

Průvodce vysokými školami

Průvodce vysokými školami

Příručka o vysokých školách v Evropském regionu

Best Practice Projekty

Best Practice Projekty

Z oblasti vysokoškolského vzdělávání

Letní brigády v ERDV

Letní brigády v ERDV

Získejte zkušenosti

Fotobanka ERDV

Fotobanka ERDV

Fotografie k širokému užití

28 hradů a zámků

28 hradů a zámků

Objevte výjimečnou památku

28 nejhezčích okružních výletů pro pěší

28 nejhezčích okružních výletů pro pěší

Výlety napříč Evropským regionem

28 nejhezčích jednodenních výletů

28 nejhezčích jednodenních výletů

Na kole skrz Evropský region

28 tradičních receptů

28 tradičních receptů

Vaříme s Evropským regionem

TIPY na muzea a galerie

TIPY na muzea a galerie

Mnohostranná nabídka

Vaříme dobře

Vaříme dobře

Chutě Evropského regionu

Dvoujazyčnost v ERDV

Dvoujazyčnost v ERDV

Naše nabídka

Glosář

Glosář

Glosář

Moderní obce

Moderní obce

Hovoříme o příkladech digitalizace

Databanka obcí

Databanka obcí

Celkový přehled všech obcí po celém regionu ERDV

Inspirace k moderní obci

Inspirace k moderní obci

Příklady digitalizace online