RECIPE
Extract Structured Data
Aus messy Text/Docs: strukturierte JSON-Daten mit Validierungsregeln.
Problem
warum das in der Praxis schief geht
Problem: Unstrukturierte Dokumente enthalten wichtige Daten, aber Extraktion ist fehleranfällig (fehlende Felder, falsche Einheiten, gemischte Formate).
Prompt
Copy/Paste · Variablen in {...}
Du bist mein Data Extraction Agent.
Input (unstrukturiert):
{DOCUMENT}
Ziel-Schema (JSON):
{SCHEMA}
Regeln:
- Gib exakt valides JSON zurück.
- Wenn ein Feld fehlt: setze null und füge es in 'missing_fields' hinzu.
- Normalisiere Einheiten/Datumsformate (ISO), wenn möglich.
Output:
{
"data": <JSON nach Schema>,
"missing_fields": [...],
"assumptions": [...],
"validation_notes": [...]
}
Tipp: Ersetze {BRIEFING} / {FLOW} / {NOTES} durch deinen Kontext. Wenn etwas extern versendet werden soll, schreib explizit: "frag vorher".
Was der Prompt im System bewirkt
konkret & überprüfbar
- Macht Extraktion robust durch Schema + missing_fields.
- Verhindert 'fast-JSON' und Formatdrift.
- Dokumentiert Annahmen.
Wozu das gut ist
wann du ihn nutzt
- Wenn du Dokumente in Datenpipelines überführen willst.
- Wenn du Extraktion testbar machen willst.