XML in JSON oder Arrays umwandeln in PHP

Datum: 8. April 2014
Autor*in: Stefan Oswald


Ich bin heute über die mir bisher in diesem Ausmaß noch gar nicht bekannte Mächtigkeit der JSON-Funktionen von PHP gestolpert: Wie sich bei einer imx.Mapwork Anpassung herausgestellt hat, kann json_encode() so ziemlich alles als Parameter erhalten – einschließlich SimpleXMLElement. Der einzige Typ, der nicht verarbeitet werden kann, ist „resource“.

Auf diese Art ist es sehr leiht, XML in JSON, und über diesen Umweg natürlich auch in ein assoziatives Array umzuwandeln:

$xml = simplexml_load_file('data.xml');
$json = json_encode($xml);
$array = json_decode($json, true);

Einen kleinen Pferdefuß gibt es dabei, aber auch der kann umgangen werden: CDATA-Sektionen werden nicht mit umgewandelt. Das PHP-Team bewertet dies interessanter Weise nicht als Bug [1] und sagt, man solle die CDATA-Tags vorher in Strings umwandeln. Bei einem automatisierten Prozess ist das natürlich nicht so einfach möglich… die Lösung ist aber denkbar einfach: Bei der Erzeugung des SimpleXMLElement muss die Option LIBXML_NOCDATA verwendet werden. Dies ist standardmäßig nicht der Fall, aber man kann ein bestehendes SimpleXMLElement einfach erneut umwandeln:

/**
* Gives an array representation of the given SimpleXMLElement, using json_decode()
* to convert SimpleXMLElement to JSON and json_decode() to convert JSON to array.
* Also works for CDATA sections.
*
* @param SimpleXMLElement $xml
* @return array
*/
function xmlToArray(SimpleXMLElement $xml) {
$xmlString = $xml->asXML();
$xmlCopy = simplexml_load_string($xmlString, SimpleXMLElement, LIBXML_NOCDATA);
$json = json_encode($xmlCopy);
return json_decode($json, true);
}

Zuerst wird das bestehende SimpleXMLElement in einen String umgewandelt. Dieser wird dann wiederum in ein SimpleXMLElement umgewandelt, unter Verwendung der Parser-Option LIBXML_NOCDATA. Wird das somit erzeugte, neue SimpleXMLElement nun mit json_encode() geparst, werden die CDATA-Inhaltemit berücksichtigt.

[1] https://bugs.php.net/bug.php?id=41976


Dieser Artikel wurde verschlagwortet unter:


Kommentare

Selber kommentieren:






Weitere Beiträge zum Thema Technologie


Unsere Ausbildungszeit bei infomax

Autor*innen: Verena Schmuck, David Kelemen, Phil Jope


infomax   //   Technologie   //   Über den Tellerrand


Phil Jope und David Kelemen, haben 2022 ihre Ausbildung zum Fachinformatiker für Anwendungsentwicklung begonnen und dieses Jahr erfolgreich abgeschlossen. In diesem Beitrag geben sie Einblicke in ihre Ausbildungszeit bei infomax, erzählen von Herausforderungen und Lieblingsmomenten, und teilen Tipps für zukünftige Azubis.


Beitrag lesen
25
AUG
25

Browser Diet

Autor*in: Benjamin Hofmann


Technologie


Eben bin ich über t3n auf eine interessante Website gestoßen: Browser Diet. Hier geht es darum, wie der Name bereits vermuten lässt, wie man Websites im Browser beschleunigen kann. Einiges davon machen wir bereits seit einiger Zeit, einiges nicht. Ein paar Beispiele dafür sind folgende Punkte: http://browserdiet.com/#cache-array-lengths Ein viel gemachter Fehler, auch in PHP, da …


Beitrag lesen
27
MRZ
13

ModPagespeed & Kommentare in CSS

Autor*in: Sascha Nützel


Technologie


Beim gestrigen Tirol Deployment kam es zu interessanten Fehlermeldungen beim CSS Minify über ModPagespeed (Failed to load resource: net::ERR_INCOMPLETE_CHUNKED_ENCODING im Chrome bzw. 404 in FF/IE). Grund war eine Kommentierung im CSS mittels „//“, bitte verwendet daher im CSS „/* mein lustiger Kommentar */“.  


Beitrag lesen
26
AUG
16

imx.Platform News: MCP-Endpunkt, Aufgaben-Modul und neue KI-Funktionen

Autor*innen: Lena Grothe, Lorena Meyer


infomax   //   Technologie


Inhalte aus der imx.Platform werden für KI-Systeme noch besser zugänglich und redaktionelle Arbeit wird effizienter mit gleichzeitiger Erhöhung der Datenqualität: Das neue Quartal bringt eine Reihe substanzieller Erweiterungen für die gesamte imx.Platform Produktfamilie. Mit dem neuen MCP-Endpunkt der imx.Platform Content Delivery API geht die imx.Platform einen weiteren Schritt in puncto LLM-Integrationsfähigkeit der Contents. Dank des …


Beitrag lesen
21
APR
26