Web Yakalama ve Dönüştürme Araçları

Java ile Web Sitelerinden HTML Tabloları Yakala

Java API

HTML tablolarını dönüştürmenin birden çok yolu vardır into JSON, CSV ve Excel hesap çizelgeleri kullanarak GrabzİT'in Java API'si, burada detaylı en kullanışlı tekniklerden bazıları. Ancak başlamadan önce aradıktan sonra bunu hatırlayın. URLToTable, HTMLToTable or FileToTable yöntemler Save or SaveTo Tabloyu yakalamak için yöntem çağrılmalıdır. Bu hizmetin sizin için uygun olup olmadığını hızlı bir şekilde görmek istiyorsanız, bir HTML tablolarını yakalamanın canlı demosu bir URL’den

Temel Seçenekler

Bu kod pasajı, belirtilen bir web sayfasında bulunan ilk HTML tablosunu dönüştürür into bir CSV belgesi.

grabzIt.URLToTable("https://www.tesla.com");
//Then call the Save or SaveTo method
grabzIt.HTMLToTable("<html><body><table><tr><th>Name</th><th>Age</th></tr>
    <tr><td>Tom</td><td>23</td></tr><tr><td>Nicola</td><td>26</td></tr>
    </table></body></html>");
//Then call the Save or SaveTo method
grabzIt.FileToTable("tables.html");
//Then call the Save or SaveTo method

Varsayılan olarak bu, tanımladığı ilk tabloyu dönüştürür. into bir masa. Ancak, bir web sayfasındaki ikinci tablo bir 2’in setTableNumberToInclude yöntem TableOptions sınıf.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTableNumberToInclude(2);

grabzIt.URLToTable("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTableNumberToInclude(2);

grabzIt.HTMLToTable("<html><body><table><tr><th>Name</th><th>Age</th></tr>
    <tr><td>Tom</td><td>23</td></tr><tr><td>Nicola</td><td>26</td></tr>
    </table></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTableNumberToInclude(2);

grabzIt.FileToTable("tables.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");

Ayrıca kullanabilirsiniz setTargetElement sadece belirtilen eleman kimliğindeki tabloların dönüştürülmesini sağlayacak yöntem.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTargetElement("stocks_table");

grabzIt.URLToTable("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTargetElement("stocks_table");

grabzIt.HTMLToTable("<html><body><table id='stocks_table'><tr><th>Name</th><th>Age</th></tr>
    <tr><td>Tom</td><td>23</td></tr><tr><td>Nicola</td><td>26</td></tr>
    </table></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setTargetElement("stocks_table");

grabzIt.FileToTable("tables.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.csv");

Alternatif olarak, bir web sayfasındaki tüm tabloları görüntüleyebilmek için setIncludeAllTables yöntem, ancak bu yalnızca XLSX ve JSON formatlarında çalışacaktır. Bu seçenek, her bir tabloyu oluşturulan elektronik tablo çalışma kitabındaki yeni bir sayfaya yerleştirir.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setFormat(TableFormat.XLSX);
options.setIncludeAllTables(true);

grabzIt.URLToTable("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.xlsx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setFormat(TableFormat.XLSX);
options.setIncludeAllTables(true);

grabzIt.HTMLToTable("<html><body><table><tr><th>Name</th><th>Age</th></tr>
    <tr><td>Tom</td><td>23</td></tr><tr><td>Nicola</td><td>26</td></tr>
    </table></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.xlsx");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setFormat(TableFormat.XLSX);
options.setIncludeAllTables(true);

grabzIt.FileToTable("tables.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.xlsx");

HTML Tablolarını JSON'a Dönüştür

GrabzIt ayrıca web üzerinde bulunan HTML tablolarını JSON'a dönüştürebilir, bunun yerine sadece JSON biçimini belirtin. Aşağıdaki örnekte, veriler senkronize olarak okunur ve bir GrabzItFile kullanarak nesne SaveTo yöntem, ancak genellikle bunu yapmanız önerilir uyumsuz.

Dönüşüm tamamlandığında toString JSON’u bir string, bu daha sonra gibi bir kütüphane tarafından ayrıştırılabilir google gson.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setFormat(TableFormat.JSON);
options.setTableNumberToInclude(1);

grabzIt.URLToTable("https://www.tesla.com", options);

GrabzItFile file = grabzIt.SaveTo();
if (file != null)
{
    String json = file.toString();
}

Özel tanımlayıcı

Özel bir tanımlayıcıyı tablo Aşağıda gösterilen yöntemlerde, bu değer daha sonra GrabzIt Java işleyicinize döndürülür. Örneğin, bu özel tanımlayıcı, bir ekran görüntüsünün belirli bir veritabanı kaydı ile ilişkilendirilmesine izin veren bir veritabanı tanıtıcısı olabilir.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setCustomId("123456");

grabzIt.URLToTable("https://www.tesla.com", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setCustomId("123456");

grabzIt.HTMLToTable("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

TableOptions options = new TableOptions();
options.setCustomId("123456");

grabzIt.FileToTable("example.html", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");