Web Yakalama ve Dönüştürme Araçları

Veri ayıkla ve dönüştür into veri kümesi

En yaygın gereksinimlerden biri, bir web sitesinden veri ayıklamak ve açmak into İleri işleme için ihraç edilebilecek tabular yapı. Ama sadece veri kümesi nedir ve nasıl kullanılır? Grabz's Web Kazıyıcı?

Örnek veri kümesi: fiyat listesi

Veri kümesinde yer alan tablo verileri aşağıdadır fiyat listesiTablo üç sütundan oluşur. ürün etiketi, Ürün Açıklaması ve ürün fiyatı.

ürün etiketi Ürün Açıklaması ürün fiyatı
Kamera Dijital fotoğraf çeker $99.00

Bu veri kümesini oluşturmak için aşağıdaki kazıma talimatlarını kullanmanız gerekir.

Data.save('Camera', 'price list', 'item label');
Data.save('Takes digital photos', 'price list', 'item description');
Data.save('$99.00', 'price list', 'item price');

Bu kullanır Data.save eklemek için bir yöntem veri değeri belirli bir veri kümesi ve sütun. Her zaman Data.save yöntem aynı veri kümesi ve sütun adı parametreleriyle çağrılır, bu sütuna yeni bir satır eklenir. Bununla birlikte, yukarıdaki sıyırma talimatları, statik değerleri kullanarak veri kümesini oluşturduğumuz için çok kullanışlı değildir. Aşağıdaki kod bir web sayfasının HTML'sini gösterir, daha sonra verileri sayfadan dinamik olarak çıkarmak için kazıma talimatları yazacağız ve save it into bir veri kümesi.

<html>
    <body>
        <span id="spnLabel">Nikon 1055</span>
        <span id="spnDescription">Great little camera, creates clear sharp images.</span>
        <span id="spnPrice">$99.99</span>
    </body>
</html>

Şimdi kullanacağız Page.getTagValue span etiketlerinden değerleri çıkarma yöntemi.

Data.save(Page.getTagValue({"id":{"equals":"spnLabel"}}), 'price list', 'item label');
Data.save(Page.getTagValue({"id":{"equals":"spnDescription"}}), 'price list', 'item description');
Data.save(Page.getTagValue({"id":{"equals":"spnPrice"}}), 'price list', 'item price');

Gördüğünüz gibi Page.getTagValue yöntemler, metnin çıkarılması gereken HTML öğesini benzersiz bir şekilde tanımlayan bir filtre kullanır. Bu durumda, filtreler id HTML niteliğinin eşit olması gerektiğini belirtir spnLabel, spnDescription or spnPrice sırasıyla. Üzerine tıklayarak kolayca bir filtre oluşturabilirsiniz Filtre düğmesi Filtrenin yapısını basitleştirmek için bir sihirbaz gösteren simge.

Veri kümenizi burada gösterdiğimiz şekilde oluşturduktan sonra, veriyi nasıl dışa aktarmak istediğinize karar verebilirsiniz. Seçenekleri Dışa Aktar sekmesi.