KeXtract™
JSON Schema
Uno schema JSON definisce un contratto formale per i tuoi dati. Progettare uno schema chiaro e aderente al dominio riduce errori di comprensione; conoscere i limiti (performance, rigidità) evita sorprese in produzione.
JSON Schema
Un JSON Schema è uno standard che serve a descrivere in modo formale come deve essere fatto un documento JSON. Permette di definire quali campi sono presenti, quali sono obbligatori, che tipo di dati devono contenere (stringhe, numeri, array, oggetti), e quali regole devono rispettare, come valori minimi, formati specifici o lunghezze massime.
Prima di scrivere lo schema, rispondi a:
- Quali campi sono obbligatori per il mio workflow?
- Quali valori devono essere numerici/date/enum?
- Ci sono ripetizioni o gerarchie (array di oggetti, nested) da modellare?
Queste decisioni guideranno le tue scelte su required, type, format, enum e struttura ad oggetti/array.
Come realizzare un buon schema:
Sii descrittivo e specifico
Nomi chiari (routing_number vs number) e descrizioni aiutano il modello a individuare al meglio i tuoi dati; aggiungi description per ogni campo.
Usa tipi corretti
Usa number per importi, e se vuoi una data, specifica il formato stringa e specifica il formato (es: YYYY-MM-DD); evita di estrarre valori numerici come stringhe se poi devi calcolare su di essi.
Fallback e normalizzazione
Prevedi campi opzionali, pattern regex per formati comuni e utilizza gli enum per i valori dei campi codificati.
Perfeziona l’input
Verifica la qualità del documento in input per ottimizzare il consumo di token e agevolare la comprensione da parte dell'LLM
Richiedi un account di prova (che ti consente di lavorare su circa 100 pagine; costruisci il tuo schema nel playground.
Limitazioni e Rischi
Ambiguità semantica
Affidabilità e precisione
Rigidità VS Flessibilità
Analizza le risposte e raffina il tuo schema
Hai domande? Scrivici a info@kextract.it
