Web Yakalama ve Dönüştürme Araçları

Yapısal Bilgileri Yapılandırılmamış Metinden Otomatik Olarak Çıkarma?

Normal yazılı metin, kolayca çıkarılamayan birçok bilgi içerebilir. Mesela bir cümle belki bir şirket hakkında bir inceleme yapabilir, ancak iyi ya da kötü bir yorum olup olmadığını nasıl anlarsınız?

Normal bir web kazıyıcı bu bilgiyi çıkaramaz. Ancak GrabzIt, doğal dil işleme yeteneklerinde yerleşik olarak kullanabilir. Aşağıdaki örnekte gösterildiği gibi, sayfa metni analiz edilir ve aşağıdaki değerlerden birini verir Çok Negatif, Negatif, Nötr, Pozitif ve Çok Pozitif.

Data.save(Utility.Text.extractSentiment(Page.getText()), 'Dataset', 'Sentiment');

Rağmen Grabz's Web Kazıyıcı Dil tespiti, yer isimleri, insan isimleri ve kuruluş isimleri gibi metinlerden çok daha fazlasını çıkarabilir. Bunlardan örnekler aşağıda gösterilmiştir.

//Language Detection
Data.save(Utility.Text.extractLanguageName(Page.getText()), 'Dataset', 'Language');
//Identify Geographic Locations
Data.save(Utility.Text.extractLocations(Page.getText()), 'Dataset', 'Locations');
//Identify People's Names
Data.save(Utility.Text.extractNames(Page.getText()), 'Dataset', 'Names');
//Identify Organizations Names
Data.save(Utility.Text.extractOrganizations(Page.getText()), 'Dataset', 'Organizations');

Bu kazıma talimatlarından hiçbirini kendiniz yazmak zorunda değilsiniz, çünkü kazıyıcı sihirbazımızda uygun bir HTML öğesini seçtiğinizde otomatik olarak görüneceklerdir.