Tekst parsing verktøy finnes for systemadministratorer og webdesignere som har behov for å søke massive mengder tekst for å bestemme strukturen og organiseringen av IT- , system -skript eller påslag dokumenter. Raske og skitne SED og Perl -skript bygget rundt regulære uttrykk er ofte nok for enkle jobber , men analyse komplekse XML-dokumenter krever en mer robust verktøy, for eksempel Python Programming språkets ElementTree bibliotek . Du trenger
Python 2.5 eller høyere
Vis flere instruksjoner
en
starte en terminal sesjon eller, hvis du foretrekker det, åpner Python Integrated Development Environment , kjent som IDLE , som kan finnes i Python mappe på C-stasjonen ( Windows) eller Programmer-mappen ( Mac ) . Sjekk din versjon av Python ved å skrive python -v på kommandolinjen . ElementTree er en del av Python standard bibliotek som av Python 2.5. Hvis du har Python 2.4 eller tidligere, må du laste det ned fra hovedsiden Python siden .
2
Bestem hvilken type data som er kodet i et XML-dokument ved å lese roten tag . På kommandolinjen , last ElementTree og analysere funksjon med følgende kommando : en
> fra elementtree.ElementTree import parse
3
Finn filen du vil analysere og notere sin vei i forhold til den av Python tolk , eller bare flytte filen til Dokumenter-mappen . Sett en variabel for filen , lese den inn i minnet og oppdag den type data filen inneholder med følgende kommando : > treet = ElementTree ( file = filnavn ) > elem = tree.getroot ( ) > print elem
p Dette vil avsløre hvilken type data som er kodet i XML-dokumentet .