XML caratteri non ammessi - header foto

 

Ci sono diversi caratteri che in un file xml non sono ammessi. Spesso questi caratteri speciali, come ad esempio i simboli delle valute (€, $, etc.) o la famosa “&” commerciale, se inseriti all’interno della fattura elettronica, quindi nel codice xml, generano degli errori e ne compromettono l’invio.

Vediamo come sostituirli, ma prima partiamo dallo spiegare che cos’è un file Xml.

Che cos’è un file XML?

I file xml sono dei documenti creati grazie al linguaggio XML, uno dei tanti linguaggi di programmazione informatica. Il linguaggio XML, è molto simile al linguaggio HTML, uno dei più famosi e più usati nel mondo del web fin dalla sua creazione.

Come il linguaggio HTML, il linguaggio XML, è costituito da “tag”, che definiscono la struttura del documento e la modalità con cui tale documento deve essere memorizzato, visualizzato e inviato. La cosa più interessante del linguaggio XML è che permette agli utenti di creare propri tag, con i quali personalizzare il contenuto ed avere praticamente opzioni illimitate.

Ecco perché questo tipo di linguaggio è molto usato anche al di fuori del web ed è diventato lo standard per i software che creano, inviano e permettono l’apertura delle fatture elettroniche.

 

Xml caratteri non ammessi. Vediamo quali

I caratteri xml non ammessi sono di diversi tipi, oltre ai caratteri speciali, troviamo anche gli apostrofi, le virgolette e le lettere accentate. Per il ministero questi caratteri sono quelli non ammessi più utilizzati:

& – E commerciale

“” – virgolette

‘ – apostrofo

< – minore

> – maggiore

 

Xml caratteri non ammessi – come sostituirli

I caratteri non ammessi, per non generare errori, devono essere sostituiti con le rispettive entità XML, ovvero codici che interpretano il valore dei dati nel formato UTF-8 (Unicode Transformation Format, 8 bit).

Vediamo nella tabella quali sono le entità corrispondenti ai caratteri non ammessi:

Codice ASCII Carattere Entità XML
(Unicode)
34 &#34;
38 & &#38;
39 &#39;
60 < &#60;
62 > &#62;

 

Altri caratteri xml non ammessi:

Codice ASCII Carattere Entità XML
(Unicode)
128 &#128;
169 © &#169;
174 ® &#174;
192 À &#192;
193 Á &#193;
194 Â &#194;
195 Ã &#195;
196 Ä &#196;
197 Å &#197;
198 Æ &#198;
199 Ç &#199;
200 È &#200;
201 É &#201;
202 Ê &#202;
203 Ë &#203;
204 Ì &#204;
205 Í &#205;
206 Î &#206;
207 Ï &#207;
208 Ð &#208;
209 Ñ &#209;
210 Ò &#210;
211 Ó &#211;
212 Ô &#212;
213 Õ &#213;
214 Ö &#214;
215 × &#215;
216 Ø &#216;
217 Ù &#217;
218 Ú &#218;
219 Û &#219;
220 Ü &#220;
221 Ý &#221;
222 Þ &#222;
223 ß &#223;
224 à &#224;
225 á &#225;
226 â &#226;
227 ã &#227;
228 ä &#228;
229 å &#229;
230 æ &#230;
231 ç &#231;
232 è &#232;
233 é &#233;
234 ê &#234;
235 ë &#235;
236 ì &#236;
237 í &#237;
238 î &#238;
239 ï &#239;
240 ð &#240;
241 ñ &#241;
242 ò &#242;
243 ó &#243;
244 ô &#244;
245 õ &#245;
246 ö &#246;
247 ÷ &#247;
248 ø &#248;
249 ù &#249;
250 ú &#250;
251 û &#251;
252 ü &#252;
253 ý &#253;
254 þ &#254;