Přejít na hlavní obsah

1. Vytvoření schématu

Schéma definuje sloupce, které chcete extrahovat.
const schema = await client.schemas.create({
  name: "Product Catalog",
  columns: [
    { key: "product_name", label: "Product Name", type: "text", required: true },
    { key: "price", label: "Price", type: "number" },
    { key: "description", label: "Description", type: "text" },
    { key: "image_url", label: "Image", type: "image" },
  ],
});

console.log(schema.id);
Schéma můžete také vygenerovat automaticky ze vzorových dat:
const schema = await client.schemas.generate({
  sample_data: "Product: iPhone 15 Pro, Price: $999, Storage: 128GB",
  name: "Smartphones",
});

2. Nahrání souboru

Nahrajte PDF, tabulku nebo obrázek, ze kterého chcete extrahovat data.
const file = new File([buffer], "catalog.pdf", { type: "application/pdf" });
const uploaded = await client.files.upload(file, "catalog.pdf");

console.log(uploaded.id); // "file_abc123"

3. Vytvoření tabulky

Spusťte extrakci vytvořením tabulky s vaším schématem a nahraným souborem.
const table = await client.tables.create({
  schema_id: schema.id,
  name: "Q1 Product Catalog",
  file_ids: [uploaded.id],
});

console.log(table.id);     // "tbl_..."
console.log(table.status); // "processing"

4. Čekání na výsledky

SDK obsahuje pomocnou funkci pro polling, která čeká na dokončení extrakce.
const completed = await client.tables.waitForCompletion(table.id, {
  intervalMs: 3000,
  timeoutMs: 300000,
});

console.log(completed.status);     // "completed"
console.log(completed.total_rows); // 42

5. Získání řádků

const rows = await client.tables.rows(completed.id, { limit: 100 });

for (const row of rows.data) {
  console.log(row.data.product_name, row.data.price);
}

Další

Obohacení pomocí AI

Použijte AI ke generování popisků, překladu obsahu a obohacení vašich dat.