Prepoznavanje i ekstrakcija struktuiranih podataka prikaznih na veb stranicama
Abstrakt
U ovom radu predložen je metod za automatsko prepoznavanje i ekstrakciju informacija, koje odgovoraju predefenisanom kriterijumu, sa jedne ili više veb stranica, čiji je proizvod skup uređenih parova opisa i vrednosti podataka. Ako pronađeni opis podatka postoji u do sada rekonstruisanoj bazi podataka, njegova vrednost se ažurira na odgovarajući način. U slučaju da opis podatka dobijenog ekstrakcijom ne odgovara nijednom do sada sačuvanom u rekonstruisanoj bazi podataka, on postaje kandidat za dodavanje u bazu.
Ključne reči: data mining, information retrieval, pattern mathching, reverse engineering, search engine
Objavljen na sajtu: 28.12.2015