A projekt

Jogszabályváltozásokkal kapcsolatban publikált nagy mennyiségű online cikkek összegyűjtése, feldolgozása és azok relevancia, valamint minőség szerinti osztályozása, rangsorolása.

Probléma

Ügyfelünk, az egyik legnagyobb magyar jogi adatbázis-szolgáltató, szeretné a jogszabályváltozásokat nyomonkövető, saját fejlesztésű Legal Monitoring platformját bővíteni, és minél több, a változásokhoz kapcsolódó, releváns információt elérhetővé tenni ügyfelei számára.

A platform képes nyomon követni a jogszabályok különböző időbeli módosításait és adatot szolgáltatni ezekről (jogszabály címe, hatálybalépés időpontja, stb.), azonban jelenlegi formájában nem ad teljes körű tájékoztatást arról, hogy azoknak milyen gyakorlati következményei lesznek, hogyan érinti például egy adójogszabály változása a mindennapokat.

Olyan megoldásra van tehát szükségük, amely a jogszabályok módosítására vonatkozó fenti adatok szolgáltatásán túl,

  • egyrészt képes növelni mind az aktuális, mind a várható változások átláthatóságát és nyomonkövethetőségét;
  • másrészt olyan további ismertetőkkel, tudnivalókkal (például szakmai, magyarázó cikkekkel, segédanyagokkal) is támogatja ügyfeleiket, amelyek jelentős hozzáadott értéket képviselve nagy mértékben képesek fokozni ügyfeleik elégedettségét.

Megoldás és metódus

A platform többlépcsős fejlesztésének első állomásaként egy mesterséges intelligencia alapú “smart news-hunter” (intelligens hírkereső) alkalmazást fejlesztünk.

Ez a rendszer az alábbi lépések mentén teljesen automatizáltan gyűjti össze az online cikkeket, kinyeri azokból a szükséges adatokat, továbbá Természetes Nyelvfeldolgozás (NLP) segítségével a cikkeket minőségi és a változásokhoz kötődő relevanciájuk szerint rangsorolja:

  1. Adatgyűjtés és keresés futtatása

Összegyűjtjük a módosítással érintett jogszabályokat, majd az ezekből meghatározott keresési kifejezések segítségével összegyűjtjük a találatokhoz tartozó linkeket.

  1. Web-Crawling

Az általunk fejlesztett ún. scraping eszköz egyesével megnyitja az említett linkeket, kinyeri az adatokat, majd átalakítja azokat a gépi tanulás modellünk bemeneti adataivá.

  1. Cikk / Nem cikk szerinti osztályozás

A gyűjtött adatokat az általunk létrehozott gépi tanulás modell osztályozza aszerint, hogy azok cikkek vagy sem.

  1. Cikkekből adatkinyerés

A cikkekből egy másik, szintén általunk létrehozott gépi tanulás modell kinyeri a címet, a publikálás időpontját, a tartalmat, valamit a szerzőt, ha az jelölve van.

  1. Ranking

Másnéven a cikkek relevancia szerinti rangsorolása. Az adatkinyerést követően a rendszer a cikkek tartalmát összeveti a konkrét változás szövegének tartalmával, majd a cikkeket ezen hasonlóságok mentén prioritási sorrendbe rendezi.


┃Eredmények

Végeredményként egy olyan szoftver jött létre amely képes a jogszabályváltozásokkal összefüggő releváns cikkeket  automatizáltan felkeresni az interneten. Ezt követően a rendszer gépi tanulás segítségével eldönti, hogy a talált eredmény cikk-e vagy sem. Abban az esetben, ha a találat cikk, rangsorolja az adott cikket az alapján, hogy a tartalma mennyire releváns.

A fejlesztés nagyban megkönnyíti az ügyfelek számára a jogszabályváltozások áttekinthetőségét és hozzájárul a felhasználói élmény növeléséhez.