Web Yakalama ve Dönüştürme Araçları

Resimlerden metin ayıkla

Genellikle önemli metin bilgileri görüntülerde saklanabilir. ancak Grabz's Web Kazıyıcı Optik Karakter Tanıma özelliğini kullanarak bu bilgiyi otomatik olarak alma imkanı sağlar. Her ne kadar bu yapay bir form olmasına rağmen intdikkat sonuçları her zaman mükemmel değildir.

Resimlerden metin çıkarmak için, Utility.Image.extractText aşağıda gösterildiği gibi yöntem.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

Bu örnekler hem tüm resim URL’lerini web sayfasından alır, hem de URL’yi her resimden metin verileri çıkarmayı deneyen ve eşleşmeleri bir dizi olarak geri döndüren URL’leri extractText yöntemine iletir. strings.

Görüntüdeki metin farklı bir dilde ise, aşağıda gösterildiği gibi iki harf (ISO 639-1) biçimini kullanarak doğru dil kodunu belirtmeniz gerekir.

var textArray = Utility.Image.extractText(Page.getTagAttributes('src', {"tag":{"equals":"img"}}), 'fr');