Web Yakalama ve Dönüştürme Araçları

Bir web sitesinden e-posta adreslerini kazıyın

Aşağıdaki iki örnek aynı şablon.

Grabz's Web Kazıyıcı bir web sitesinden e-posta adreslerini çıkarmayı kolaylaştırmak için birkaç özel yardımcı yöntem sağlar. Aşağıdaki örnek, tüm HTML içeriğini bir web sayfasından alır ve daha sonra Utility.Text.extractAddresses adresleri kaydetmeden önce geçerli tüm e-posta adreslerini bulma yöntemi into daha sonra kullanıcıya gönderilen veri kümesi.

Alternatif olarak, yalnızca ilk eşleşen e-posta adresi, Utility.Text.extractAddress yöntemi.

Data.save(Utility.Text.extractAddresses(Page.getHtml()));

PDF belgelerinden e-posta adreslerini kazıyın

PDF belgeleri de kazıyabilir e-posta adresleri için, web sayfalarının yukarıda nasıl çizildiğine benzer şekilde. Aşağıdaki örnekte görebileceğiniz gibi süreç, bunun haricinde tamamen aynıdır. PDF.getText() yerine yöntem kullanılır Page.getHtml() yöntemi.

Data.save(Utility.Text.extractAddresses(PDF.getText()));

Resimlerden e-posta adreslerini kazıyın

Kepçe özelliği var resimlerden metin çıkar Bu, bu yeteneğin görüntülerden e-posta adreslerini almak için de kullanılabileceği anlamına gelir. Aşağıdaki örnekte, bir web sayfasındaki tüm resimlerden e-posta adresleri çıkarılmaktadır.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}))));

Aşağıdaki kazıma talimatları, PDF belgelerinde bulunan resimlerden herhangi bir e-posta adresi çıkartıyor.

Data.save(Utility.Text.extractAddresses(Utility.Image.extractText(PDF.getValue({"type":"image"}))));