Grabz's Web Kazıyıcı bir web sitesinden e-posta adreslerini çıkarmayı kolaylaştırmak için birkaç özel yardımcı yöntem sağlar. Aşağıdaki örnek, tüm HTML içeriğini bir web sayfasından alır ve daha sonra Utility.Text.extractAddresses
adresleri kaydetmeden önce geçerli tüm e-posta adreslerini bulma yöntemi into daha sonra kullanıcıya gönderilen veri kümesi.
Alternatif olarak, yalnızca ilk eşleşen e-posta adresi, Utility.Text.extractAddress
yöntemi.
Data.save(Utility.Text.extractAddresses(Page.getHtml()));
PDF belgeleri de kazıyabilir e-posta adresleri için, web sayfalarının yukarıda nasıl çizildiğine benzer şekilde. Aşağıdaki örnekte görebileceğiniz gibi süreç, bunun haricinde tamamen aynıdır. PDF.getText()
yerine yöntem kullanılır Page.getHtml()
yöntemi.
Data.save(Utility.Text.extractAddresses(PDF.getText()));
Kepçe özelliği var resimlerden metin çıkar Bu, bu yeteneğin görüntülerden e-posta adreslerini almak için de kullanılabileceği anlamına gelir. Aşağıdaki örnekte, bir web sayfasındaki tüm resimlerden e-posta adresleri çıkarılmaktadır.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));
Aşağıdaki kazıma talimatları, PDF belgelerinde bulunan resimlerden herhangi bir e-posta adresi çıkartıyor.
Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));