Dr. Németh Renáta előadása (2025-10-09)

A természetesnyelv-feldolgozás (natural language processing) szociológiai lehetőségei

Bár a nyelv a társadalmi interakciók egy fontos eszköze, a kvantitatív társadalomkutatás – elsősorban adatgyűjtési és feldolgozási eszközök hiányában - mégsem használta igazán évtizedeken át. A helyzet az utóbbi évtizedben - a digitális forradalomnak köszönhetően - gyökeresen megváltozott, a „text as data” mozgalom keretében a szöveges adat, mint empirikus társadalomkutatási bázis használata exponenciális ütemben terjed. A társadalmat leíró szöveges adatok forradalmával párhuzamosan az utóbbi tíz évben a számítási kapacitások és azzal párhuzamosan az adatok elemzésére szolgáló szöveganalitikai technológiák robbanásszerű fejlődése is bekövetkezett, s az új technológiák a szöveg feldolgozásának már releváns mélységét nyújtják. Ez a robbanás a számítástudomány és számítógépes nyelvészet üzleti alkalmazásai után a bölcsészet- és a társadalomtudományokat, így a szociológiát is elérte. A természetes nyelvfeldolgozás (natural language processing, NLP) társadalomkutatási alkalmazási specifikumát az adja, hogy az itt tárgyalt problémák egy évszázados kutatási paradigmába vannak ágyazva, kérdésfeltevései így lényegesen különböznek a számítástudomány vagy az ipari felhasználás kérdéseitől. Ennek a különbségnek pedig tudatában kell lennünk, amikor adaptáljuk az informatika oldaláról érkező innovációt. Az előadás ezekből az inspiráló lehetőségekből mutat be be néhányat, az ELTE Társadalomtudományi Karán a Research Center for Computational Social Science kutatócsoportban 2018 óta folyó kutatásokon, mint esettanulmányokon keresztül.

Vissza az előadásokhoz