Web Yakalama ve Dönüştürme Araçları

Ürün Listesi ve Detay Sayfaları Kazıma

Web sitelerinde, genellikle öğelerin bir listesini içeren bir arama sayfası bulunur ve her bir öğeye, öğeyle ilgili ayrıntılı bilgi içeren ayrıntılı bir sayfaya bağlantı içeren bir özet açıklama verilir.

Bu yapı çok sık kullanıldığı için, her bir öğe hakkında arama sayfasından ve geri kalanı detay sayfasından bazı bilgileri kazıma ihtiyacı duyulur. Bu makale bu bilgilerin nasıl çizileceği konusunda yol gösterici olacaktır.

Önce, kazımak istediğiniz ürün listesi sayfasının URL'sini girin. Ardından, ürün listesi sayfasından seçmek istediğiniz bilgiyi seçin. Tüm veri örneklerinin seçildiğinden emin olun.

Sonra kazıma talimatları sayfasında, Tamam Kazıma Talimatı Ekle.

Farkında olunması gereken ilk şey, kazıyıcımızın bir tarayıcıyla tam olarak aynı şekilde çalışmasıdır, bu nedenle, bir çerez güvenlik bildirimi veya sayfada tıklanmanızı önleyen başka bir satır içi açılır pencere açılırsa, açılır pencereden önce açılan pencereyi kapatmasını istemeniz gerekir sıyrığın geri kalanı yapılabilir. Bu pop-up'ların çoğunun yalnızca bir kez tıklanması gerekir ve böylece GrabzIt'a aynı işlemi yapmasını söyleyebilirsiniz. Bunu yapmak için Öğe'yi tıklayın eylemi ve açılır pencereyi kapatmak için gereken HTML öğesini tıklayın. Sonra Bir Kez Sadece seçeneğini ve ardından Save ve sonra.

Ardından Verileri ayıklamak İşlemi yapın, ardından çıkarmak istediğiniz verileri seçin. Öyleyse, bir öğenin başlığını, arama sonuçları listesinden seçmek isterseniz. Bu listedeki her başlığın seçildiğinden emin olun.

Sihirbazımız veri kümelerini otomatik olarak tanımlamaya çalışır ve otomatik olarak istediğinizden daha fazla bilgi seçebilir. Bu durumda, seçilmesini istemediğiniz öğeleri bir kez daha tıklayın ve artık eklenmeyecekler. Bu bizim web kazıyıcıya ne çıkarmamız gerektiğini öğretir.

Şimdi, çıkarmak istediğiniz veri öğesinin niteliğini seçin. "Metin" gibi ve sonra İleri'yi tıklatın. Bir sonraki ekranda bir başlık verin. Burada tüm verilerin Varsayılan Şablonu kullanmasını istediğinizi unutmayın. Bunun nedeni, verilerin özel bir şablonda olmadığı zamanlarda çıkarılmasını istemenizdir.

Ürün arama sayfasından çıkarmak istediğiniz tüm verileri seçtikten sonra. Ürün detay sayfasında daha fazla bilgi için tüm linkleri seçin. Bu, örneğin görüntü olabilir. Sonra tıklayın Öğe'yi tıklayın aksiyon. Şablonu "detay" olarak ayarlayın ve ardından beş saniyelik bir gecikme bırakın ve İleri'yi tıklayın. Yeni sayfadan veri çıkarmak isteyip istemediğiniz sorulduğunda, evet'i seçin. Şimdi daha önce olduğu gibi çıkarmak istediğiniz verileri seçin. Ancak bu sefer, "detay" şablonu altında yürütülmesi gerektiğini belirtin.

Başka bir kazıma talimatı ekle ve ana sayfaya geri dön. Bu sefer sayfalandırma bağlantılarından bir sonraki düğmeyi seçin. Ne zaman Eylem'i seçenek kutusu görünür, lütfen sonraki sayfa düğmesi seçeneği. Bu şekilde sıyırıcı bu düğmenin aslında bir sayfalama düğmesi olduğunu bilir ve tüm sonuçlara göre sayfalandırır. Lütfen bu sıyırma talimatını en son kullandığınızdan emin olun. Son sıyırma talimatı değilse, sonuna kadar sürüklenebilir.

Sonra zaman çizelgesi sekmesine gidin ve kazıma başlatmak için Oluştur'u tıklatın. Sıyırma işleminin ilerlemesini gerçek zamanlı olarak Sıfırları Yönet sayfasında, satır simgesine ve ardından sıyırın simgesine tıklayarak izleyebilirsiniz.