лематизација

лематизација (од лема < лат. lēmma ‘тема, предмет’ < грч. λῆμμα [lêmma] ‘оно што је примљено’; енгл. lemma) 1. једна од уобичајених техника анотације електронског корпуса, која се спроводи у циљу његове припреме за лингвистичку анализу или лексикографски рад. Поступак лематизације подразумева да се свакој речи која је употребљена у корпусу додели одговарајући податак о њеној врсти и облику у коме се налази. На тај начин омогућава се груписање свих морфолошких ликова неке променљиве речи, како би се њене форме могле анализирати као целина, идентификована помоћу леме – речничког облика те речи. Претрага лематизованог корпуса омогућава кориснику да упитом у форми леме добије све флективне облике тражене речи. На пример, упит у форми номинатива једнине за именице резултује једноставним истовременим добијањем свих падежних облика те именице у једнини и множини (упит: жена; резултат: жена, жене, жени, жену, женом, женама), док је приликом претраге нелематизованог корпуса неопходно поновити упит за добијање сваког падежног облика појединачно. У процесу лематизације, за сваку граматичку врсту речи уобичајен је одређени морфолошки лик, тј. утврђена речничка лема (за именице – номинатив једнине, за придеве – номинатив једнине мушког рода, за глаголе – инфинитив итд.). Неки истраживачи употребљавају термин лексема и за означавање основног речничког облика речи, тј. њеног одредничког облика у лексикографији, те отуда лематизацију тумаче као свођење алолекси на лексеме у неком корпусу (Шипка). Исп. лема. 2. у рачунарској лингвистици, алгоритамски поступак одређивања леме речи на основу њеног предвиђеног значења, при чему успешност поступка зависи од прецизности алгоритма и правилног идентификовања лексичких јединица и њиховог значења у реченици или ширем контексту.

Литература:
Ивановић, Ненад, „Рачунарске технологије у српској лексикорафији (могућности и перспективе)”, у: Р. Драгићевић (ур.), Савремена српска лексикографија у теорији и пракси (колективна монографија), Београд: Филолошки факултет, 2014, 249–290.
Klobučar Srbić, Iva, „Obol korpusne lingvistike suvremenoj leksikografiji. Studia lexicographica, 2 (3), 2008, 39–51.
Collins English Dictionary, https://www.collinsdictionary.com/dictionary/english/lemmatize
Šipka, Danko, Osnovi leksikologije i srodnih disciplina, Novi Sad: Matica srpska, 2006.