medina.consults.de
RECIPE

Extract Structured Data

Aus messy Text/Docs: strukturierte JSON-Daten mit Validierungsregeln.

Problem

warum das in der Praxis schief geht

Problem: Unstrukturierte Dokumente enthalten wichtige Daten, aber Extraktion ist fehleranfällig (fehlende Felder, falsche Einheiten, gemischte Formate).

Prompt

Copy/Paste · Variablen in {...}
Du bist mein Data Extraction Agent.

Input (unstrukturiert):
{DOCUMENT}

Ziel-Schema (JSON):
{SCHEMA}

Regeln:
- Gib exakt valides JSON zurück.
- Wenn ein Feld fehlt: setze null und füge es in 'missing_fields' hinzu.
- Normalisiere Einheiten/Datumsformate (ISO), wenn möglich.

Output:
{
  "data": <JSON nach Schema>,
  "missing_fields": [...],
  "assumptions": [...],
  "validation_notes": [...]
}

Tipp: Ersetze {BRIEFING} / {FLOW} / {NOTES} durch deinen Kontext. Wenn etwas extern versendet werden soll, schreib explizit: "frag vorher".

Was der Prompt im System bewirkt

konkret & überprüfbar
  • Macht Extraktion robust durch Schema + missing_fields.
  • Verhindert 'fast-JSON' und Formatdrift.
  • Dokumentiert Annahmen.

Wozu das gut ist

wann du ihn nutzt
  • Wenn du Dokumente in Datenpipelines überführen willst.
  • Wenn du Extraktion testbar machen willst.