Historie češtiny v korpusovém kontinuu

Technologická agentura ČR

Program: TQ – Program na podporu aplikovaného výzkumu a inovací SIGMA

Registrační číslo: TQ01000172

Hlavní řešitel: Mgr. Martin Stluka, Ph.D., Ústav Českého národního korpusu, Filozofická fakulta Univerzity Karlovy

Spoluřešitel: PhDr. Jiří Pergler, Ph.D., oddělení vývoje jazyka ÚJČ AV ČR

Doba řešení: 2023–2026

 

Anotace:

Cílem projektu HiČKoK je přispět k digitalizaci vzdělávání vytvořením datového, softwarového a znalostního zázemí pro studium češtiny v celém jejím historickém kontinuu (13.–21. století). Výsledkem implementace by mělo být vytvoření a zpřístupnění a) Monitorovacího korpusu (MKČ) pokrývajícího všechny etapy vývoje češtiny; b) jazykových modelů ve schématu Universal Dependencies (UD), které umožní automatickou lingvistickou anotaci textů z libovolného období; c) aplikace Timeline Maker umožňující zkoumat diachronní fenomény v MKČ; d) online kurzu pro studenty a badatele pracující s historickými texty, který poskytne průpravu pro využití vytvořených výstupů a dalších relevantních technologií, které jsou dostupné v rámci projektového konsorcia.