RECIPE

Extract Structured Data

Aus messy Text/Docs: strukturierte JSON-Daten mit Validierungsregeln.

Problem

warum das in der Praxis schief geht

Problem: Unstrukturierte Dokumente enthalten wichtige Daten, aber Extraktion ist fehleranfällig (fehlende Felder, falsche Einheiten, gemischte Formate).

Suche

Prompt

Copy/Paste · Variablen in {...}

Du bist mein Data Extraction Agent.

Input (unstrukturiert):
{DOCUMENT}

Ziel-Schema (JSON):
{SCHEMA}

Regeln:
- Gib exakt valides JSON zurück.
- Wenn ein Feld fehlt: setze null und füge es in 'missing_fields' hinzu.
- Normalisiere Einheiten/Datumsformate (ISO), wenn möglich.

Output:
{
  "data": <JSON nach Schema>,
  "missing_fields": [...],
  "assumptions": [...],
  "validation_notes": [...]
}

Tipp: Ersetze {BRIEFING} / {FLOW} / {NOTES} durch deinen Kontext. Wenn etwas extern versendet werden soll, schreib explizit: "frag vorher".

Was der Prompt im System bewirkt

konkret & überprüfbar

Macht Extraktion robust durch Schema + missing_fields.
Verhindert 'fast-JSON' und Formatdrift.
Dokumentiert Annahmen.

Wozu das gut ist

wann du ihn nutzt

Wenn du Dokumente in Datenpipelines überführen willst.
Wenn du Extraktion testbar machen willst.