O databázi Neomat

Elektronický neologický archiv Neomat tvoří významnou část materiálových sbírek oddělení současné lexikologie a lexikografie Ústavu pro jazyk český AV ČR, v. v. i.

Počátky elektronicky ukládané neologické excerpce spadají do začátku 90. let 20. století (první záznamy v neologické excerpční databázi pocházejí z listopadu 1991). Do podoby soustavně budovaného neologického archivu se excerpce postupně formovala v rámci grantu Popis nové slovní zásoby s využitím počítačové techniky (1994–1996), a to v úzké souvislosti s probíhajícím výzkumem neologické slovní zásoby a s přípravou speciálního slovníku neologismů. Sběr nového lexikálního materiálu byl zaměřen na nová slova, nové významy, nové víceslovné jednotky a rovněž na novou spojitelnost. V menší míře se zachycovala slova starší, zatím nezpracovaná ve výkladových slovnících.

Neologická databáze byla dále budována v průběhu následných grantových projektů Systémotvorné procesy neologizmů v současné češtině (1998–2000) a Internacionalizmy v nové slovní zásobě češtiny (2001–2003). Excerpovány byly texty všech funkčních stylů, nejvíce z publicistiky, řidčeji z beletrie a překladové literatury. Při získávání nového materiálu se přihlíželo k sociolingvistickým aspektům, např. k věkové diferenciaci (vypisovaly se texty pro mládež), k aktuálním tématům, která s sebou doba přinášela (ekologie, životní styl apod.), vybíraly se texty z různého zájmového prostředí, stranou nezůstávalo ani územní hledisko (příležitostně byl sledován i regionální tisk). V takto zaměřené excerpci se pokračovalo až do r. 2005.

Neologický lexikální materiál z let 1991–2005 byl využit pro zpracování obou slovníků neologismů – Nová slova v češtině. Slovník neologizmů 1 (1998) a Nová slova v češtině. Slovník neologizmů 2 (2004) a rovněž při tvorbě sborníku Neologizmy v dnešní češtině (2005).

Druhá část elektronického archivu Neomat, zahrnující excerpci od r. 2005, je koncipována šířeji, jako archiv lexikální dynamiky (registrující i nové slovesné vazby, posuny ve stylovém hodnocení slov ap.). Archiv je neustále doplňován; pro sběr lexikálního materiálu se aktivně využívají elektronické textové archivy (např. databáze společnosti NEWTON Media, a. s.) a internetové zdroje.

Zpřístupňování neologického archivu probíhalo po etapách: v roce 2011 bylo zveřejněno 132 000 hesel, v roce 2013 bylo zveřejněno 202 340 hesel. Od září roku 2015 je neologický archiv Neomat plně zpřístupněn jak laické, tak odborné veřejnosti. Aktualizace probíhá v pravidelných týdenních intervalech.

Podrobněji viz H. Goláňová: Novočeský lexikální archiv a excerpce v průběhu let 1911–2011. In: Slovo a slovesnost, 72, 2011, č. 4, s. 287–300.

© Ústav pro jazyk český AV ČR, v. v. i., realizace: FoxCom, s. r. o.

Správa neologických excerpčních sbírek Neomat, funkčnost a supervize databáze EDA: Ivona Tintěrová; koncepční řešení modulu pro veřejnost: Albena Rangelova, CSc., PhDr. Zdeňka Tichá, Ivona Tintěrová; koncepční řešení modulu pro odbornou veřejnost Ivona Tintěrová.
Analýza a architektura softwarového systému: Ing. Tomáš Liška, Ph.D.; vývoj softwaru: Ing. Lukáš Janda a Ing. Martin Marek; grafické zpracování: Bety Širůčková.
Program EDA a modul pro veřejnost byly zprovozněny v rámci výzkumného záměru AV0Z90610521 Vytvoření databáze lexikální zásoby českého jazyka počátku 21. století  (2005–2011).

Poslední aktualizace obsahu webu:   29 10 2024