Galite būti girdėję apie išplėstinę dokumentų aprašų kalbą (XML) ir apie daug priežasčių, kodėl ji turėtų būti naudojama jūsų organizacijoje. Tačiau kas tiksliai yra XML? Šiame straipsnyje paaiškinami XML pagrindai – kas tai yra ir kaip tai veikia.
Šiame straipsnyje
Trumpa žymėjimo tipų ir žymių apžvalga
Norint suprasti, kas yra XML, naudinga suprasti, kas yra duomenų žymėjimas. Žmonės per amžius kūrė dokumentus ir tiek pat laiko juos žymėjo. Pavyzdžiui, mokyklose mokytojai visą laiką žymi studentų darbus. Jie nurodo studentams perkelti pastraipas, aiškiau išreikšti sakinį, ištaisyti rašybos klaidas ir t. t. Dokumentų žymėjimas yra dokumento informacijos struktūros, prasmės ir išvaizdos apibrėžimas. Jei esate naudoję programos „Word“ keitimų sekimo priemonę, naudojote kompiuterizuotą žymėjimo formą.
Kompiuterijoje „žymėjimas“ tapo „žyme“. Žymėjimas yra kodų, vadinamų žymėmis (arba kartais ženklais), naudojimo procesas norint apibrėžti bet kokių duomenų struktūrą, išvaizdą ir (XML atveju) prasmę.
Šio straipsnio HTML kodas yra geras kompiuterinio žymėjimo dirbant pavyzdys. Jei jame naršysite (naršyklėje „Microsoft Internet Explorer“ dešiniuoju pelės mygtuku spustelėkite puslapį ir spustelėkite Rodyti šaltinį), matysite įskaitomo teksto ir hiperteksto žymėjimo kalbos (HTML) žymių, pvz., <p> ir <h2>, derinį. HTML ir XML dokumentų žymes lengva atpažinti, nes jos įtrauktos į kampuotus skliaustelius. Šio straipsnio šaltinio kode HTML žymės atlieka įvairias užduotis, pvz., apibrėžia kiekvienos pastraipos pradžią ir pabaigą (<p> ... </p>) ir žymi kiekvieno atvaizdo vietą.
Puslapio pradžia
Taigi, dėl ko tai yra XML?
HTML ir XML dokumentuose yra duomenų, aplink kuriuos yra žymės, bet tai yra vienintelis dviejų kalbų panašumas. HTML žymės apibrėžia jūsų duomenų išvaizdą ir naudojimą – čia yra antraštės, čia prasideda pastraipa ir t. t. XML žymės apibrėžia jūsų duomenų struktūrą ir prasmę – kas yra duomenys.
Kai aprašote savo duomenų struktūrą ir prasmę, tuos duomenis galima pakartotinai naudoti įvairiais būdais. Pavyzdžiui, jei turite pardavimo duomenų bloką, o kiekvienas bloko elementas aiškiai apibrėžtas, į pardavimo ataskaitą galite įkelti tik tuos elementus, kurių jums reikia, o kitus elementus įkelti į apskaitos duomenų bazę. Kitaip tariant, galite naudoti vieną sistemą savo duomenims generuoti ir žymėti XML žymėmis, tada apdoroti tuos duomenis bet kokioje kitoje sistemoje, neatsižvelgiant į aparatūros platformą ar operacinę sistemą. Šis mobilumas yra pagrindinė priežastis, kodėl XML tapo viena iš populiariausių duomenų mainų technologijų.
Tęsdami atsiminkite šiuos faktus:
Matote, kad naudojant XML žymes, galima tiksliai žinoti, į kokius duomenis žiūrima. Pavyzdžiui, žinote, kad šie duomenys yra apie katę, ir galite lengvai rasti katės vardą, amžių ir kt. Dėl gebėjimo kurti žymes, kurios apibrėžia beveik bet kokio tipo duomenų struktūrą, XML yra „išplėstinis“.
Nesupainiokite šiame kodų pavyzdyje esančių žymių su HTML failo žymėmis. Pavyzdžiui, jei įklijuosite šią XML struktūrą į HTML failą ir peržiūrėsite failą savo naršyklėje, rezultatas atrodys maždaug taip:
Izzy Siamese 6 yes no Izz138bod Colin Wilcox
Naršyklė nepaiso jūsų XML žymių ir rodo tik duomenis.
Puslapio pradžia
Pora žodžių apie tinkamai suformuotus duomenis
Kas nors iš jūsų IT skyriaus gali paminėti tinkamai suformuotą XML. Tinkamai suformuoto XML failas atitinka labai griežtų taisyklių, kurios valdo XML, rinkinį. Jei failas neatitinka šių taisyklių, XML neveikia. Pavyzdžiui, kiekviena ankstesnio kodų pavyzdžio atidaromoji žymė turi uždaromąją žymę, todėl pavyzdys atitinka vieną iš tinkamo formavimo taisyklių. Jei pašalinsite žymę ir bandysite atidaryti failą naudodami vieną iš sistemos Office programų, bus rodomas klaidos pranešimas, o programa neleis naudoti to failo.
Jums nebūtinai reikia žinoti tinkamai suformuoto XML kūrimo taisykles (nors jos paprastos ir lengvai suprantamos), tačiau turėtumėte atsiminti, kad XML duomenis galite bendrai naudoti programose ir sistemose tik tada, jei jie yra tinkamai suformuoti. Jei negalite atidaryti XML failo, greičiausiai failas suformuotas netinkamai.
XML yra nepriklausomas nuo platformos, tai reiškia, kad bet kuri programa, skirta naudoti XML duomenis, gali skaityti ir apdoroti jūsų XML duomenis, neatsižvelgiant į aparatūrą ar operacinę sistemą. Pavyzdžiui, naudodami tinkamas XML žymes, galite naudoti darbalaukio programą, kad galėtumėte atidaryti duomenis ir su jais dirbti kompiuteryje su pagrindine įranga. Neatsižvelgdami į tai, kas sukūrė XML duomenų tekstą, galite dirbti su tais pačiais duomenimis keliose sistemos Microsoft Office 2003 ir Microsoft Office Professional 2007 programose, įskaitant Microsoft Office Access 2007, Microsoft Office Word 2007, Microsoft Office InfoPath 2007 ir Microsoft Office Excel 2007. XML yra labai mobili, todėl ji tapo viena iš populiariausių duomenų mainų tarp duomenų bazių ir vartotojų darbalaukių technologijų.

Kartu su sužymėtais ir tinkamai suformuotais duomenimis, XML sistemos paprastai naudoja du papildomus komponentus: schemas ir transformacijas. Šiuose skyriuose paaiškinama, kaip veikia šie papildomi komponentai.
Puslapio pradžia
Žvilgsnis į schemas
Neleiskite terminui „Schema“ jūsų įbauginti. Schema yra tiesiog XML failas, kuriame yra taisyklės, kas gali ir ko negali būti XML duomenų faile. Schemų failai paprastai naudoja .xsd failo vardo plėtinį, o XML duomenų failas naudoja .xml plėtinį.
Schemos leidžia programoms tikrinti duomenis. Jos pateikia duomenų struktūravimo pagrindą ir padeda užtikrinti, kad duomenys bus prasmingi tiek kūrėjui, tiek kitiems vartotojams. Pavyzdžiui, jei vartotojas įveda neleistinus duomenis, pavyzdžiui, tekstą į datos lauką, programa gali raginti vartotoją įvesti teisingus duomenis. Kol XML faile esantys duomenys atitinka pateiktos schemos taisykles, bet kuri XML palaikanti programa gali naudoti tą schemą duomenims skaityti, aiškinti ir apdoroti. Pavyzdžiui, šioje iliustracijoje pavaizduota, kad programos Excel ir Word gali tikrinti <KATĖ> duomenis pagal schemą KATĖ.

Schemos gali tapti sudėtingos, o mokyti jus kurti schemas nėra šio straipsnio paskirtis (be to, greičiausiai turite IT skyrių, kuris žino, kaip tai daryti). Tačiau naudinga žinoti, kaip schemos atrodo. Ši schema apibrėžia žymių rinkinio <KATĖ> ... </KATĖ> taisykles.
<xsd:element name="KATĖ">
<xsd:complexType>
<xsd:sequence>
<xsd:element name="VARDAS" type="xsd:string"/>
<xsd:element name="VEISLĖ" type="xsd:string"/>
<xsd:element name="AMŽIUS" type="xsd:positiveInteger"/>
<xsd:element name="STERILIZUOTA" type="xsd:boolean"/>
<xsd:element name="NUKIRPTAIS_NAGAIS" type="xsd:boolean"/>
<xsd:element name="LICENCIJA" type="xsd:string"/>
<xsd:element name="ŠEIMININKAS" type="xsd:string"/>
</xsd:sequence>
</xsd:complexType>
</xsd:element>
Nesirūpinkite, jei supratote ne visą informaciją, pateiktą pavyzdyje. Tiesiog atsiminkite šiuos faktus:
- Pavyzdžio schemos eilučių elementai vadinami apibrėžimais. Jei jums reikėjo papildomos informacijos apie gyvūną, pvz., jo spalvas arba dėmes, jūsų IT skyrius greičiausiai pridės apibrėžimą prie schemos. Plėsdami savo verslą galite keisti savo XML sistemą.
- Apibrėžimai leidžia labai griežtai valdyti duomenų struktūrą. Pavyzdžiui, apibrėžimas
<xsd:sequence> reiškia, kad tokios žymės kaip <NAME> ir <BREED> turi būti rodomos tokia tvarka, kokia jos išvardytos aukščiau. Apibrėžimai taip pat valdo duomenų, kuriuos gali įvesti vartotojas, tipus. Pavyzdžiui, aukščiau esančiai schemai reikia teigiamo skaičiaus, nurodančio katės amžių, ir Bulio (TRUE arba FALSE) reikšmių žymėms ALTERED ir DECLAWED.
- Kai XML faile esantys duomenys atitinka schemos pateiktas taisykles, duomenys laikomi leistinais. XML duomenų failo tikrinimo pagal schemą procesas vadinamas (pakankamai logiškai) tikrinimu. Didelis schemų naudojimo pranašumas yra tas, kad jos gali padėti uždrausti sugadintus duomenis. Taip pat jos leidžia lengvai rasti sugadintus duomenis, nes susidūrusi su problema, XML sustoja.
Puslapio pradžia
Žvilgsnis į transformacijas
Anksčiau užsiminėme, kad XML taip pat pateikia patogių būdų naudoti arba pakartotinai naudoti duomenis. Pakartotinio duomenų naudojimo mechanizmas vadinamas išplėstinės stilių lapų kalbos transformacija (XSLT) arba tiesiog transformacija. Transformacijų aspektu XML tampa tikrai įdomi. Pavyzdžiui, patikrinę duomenų failą pagal schemą, galite taikyti transformaciją, dėl kurios duomenys programoje Microsoft Office Word 2003 veikia kaip rinkodaros brošiūra, ir kitą transformaciją, kad sukurtumėte pardavimo ataskaitą programoje Office Excel 2007.
Jūs (na gerai, jūsų IT skyrius) galite taikyti transformacijas norėdami mainytis duomenimis tarp galutinių sistemų, pvz., duomenų bazių. Tarkime, kad duomenų bazėje A pardavimo duomenys saugomi kaip lentelė, kuri tinka pardavimo skyriui. Duomenų bazėje B pajamų ir išlaidų duomenys saugomi kaip lentelė, kuri skirta buhalterijai. Duomenų bazė B gali naudoti transformaciją, kad priimtų duomenis iš duomenų bazės A ir rašytų juos į tinkamą lentelę.
Duomenų failo, schemos ir transformacijos derinys sudaro bazinę XML sistemą. Šioje iliustracijoje vaizduojama, kaip tokios sistemos paprastai veikia. Duomenys tikrinami pagal schemą, tada juos visais įmanomais būdais keičia transformacija. Šiuo atveju transformacija išdėsto duomenis tinklalapio lentelėje.

Šis kodo pavyzdys rodo vieną iš būdų transformacijai rašyti. Jis įkelia <KATĖ> duomenis į tinklalapyje esančią lentelę. Šis pavyzdys neskirtas parodyti, kaip rašyti transformaciją, jis tik vaizduoja vieną iš formų, kurią gali įgauti transformacija.
<?xml version="1.0"?>
<xsl:stylesheet version="1.0">
<TABLE>
<TR>
<TH>Vardas</TH>
<TH>Veislė</TH>
<TH>Amžius</TH>
<TH>Sterilizuota</TH>
<TH>Nukirpti nagai</TH>
<TH>Licencija</TH>
<TH>Savininkas</TH>
</TR>
<xsl:for-each select="KATĖ">
<TR ALIGN="LEFT" VALIGN="TOP">
<TD>
<xsl:value-of select="VARDAS"/>
</TD>
<TD>
<xsl:value-of select="VEISLĖ"/>
</TD>
<TD>
<xsl:value-of select="AMŽIUS"/>
</TD>
<TD>
<xsl:value-of select="STERILIZUOTA"/>
</TD>
<TD>
<xsl:value-of select="NUKIRPTI_NAGAI"/>
</TD>
<TD>
<xsl:value-of select="LICENCIJA"/>
</TD>
<TD>
<xsl:value-of select="SAVININKAS"/>
</TD>
</TR>
</xsl:for-each>
</TABLE>
Šis pavyzdys vaizduoja, kaip gali atrodyti užkoduota vieno tipo transformacija, tačiau atsiminkite, kad apibūdinti tai, ko norite iš duomenų, galite tik aiškia kalba. Pavyzdžiui, eiti į savo IT skyrių ir pasakyti, kad norite išspausdinti tam tikrų regionų dviejų pastarųjų metų pardavimo duomenis, kurie „turi atrodyti taip“. Tada jūsų IT skyrius galės rašyti (arba keisti) transformaciją, skirtą tai užduočiai atlikti.
Dar patogiau yra tai, kad Microsoft ir vis daugiau kitų tiekėjų kuria transformacijas, skirtas įvairų tipų užduotims atlikti. Ateityje greičiausiai galėsite atsisiųsti transformaciją, kuri atitinka jūsų reikmes arba kurią galima koreguoti pagal tas reikmes. Tai reiškia, kad bėgant laikui, XML kainuos mažiau.
Puslapio pradžia
Žvilgtelėjimas į XML Microsoft Office sistemoje
Profesionalūs Microsoft Office 2003 ir „Office 2007“ leidimas leidimai pateikia išsamų XML palaikymą.
- Office Excel 2007, Office Word 2007 ir Office PowerPoint 2007 naudoja XML kaip numatytuosius failų formatus, o tai yra pakeitimas, kurio pranašumai yra tokie:
- Mažesni failai. Naujasis formatas naudoja ZIP ir kitas glaudinimo technologijas, kad sumažintų failo dydį iki 75 procentų palyginus su dvinariais formatais, kurie naudojami ankstesnėse Office versijose.
- Paprastesnis informacijos atkūrimas ir geresnė sauga. XML gali skaityti žmogus, todėl jei failas sugadinamas, galite atidaryti failą Microsoft užrašinėje ar kitoje teksto skaitymo programoje ir atkurti bent dalį savo informacijos. Taip pat naujieji failai yra saugesni, nes juose negali būti Visual Basic for Applications (VBA) kodo. Jei kurdami šablonus naudojate naująjį formatą, visi ActiveX valdikliai ir VBA makrokomandos laikomos atskiroje saugesnėje failo dalyje. Be to, galite naudoti tokius įrankius, kaip dokumentų inspektorius, kad pašalintumėte visus asmeninius duomenis. Daugiau informacijos apie dokumentų inspektoriaus naudojimą ieškokite straipsnyje Paslėptų duomenų ir asmeninės informacijos šalinimas iš Office dokumentų.
- Didesnis mobilumas ir lankstumas. XML saugo duomenis teksto formatu, o ne savininko dvinariu formatu, todėl jūsų klientai gali apibrėžti savo schemas ir naudoti jūsų duomenis įvairiais būdais už tai nieko nemokėdami. Daugiau informacijos apie naujuosius formatus ieškokite Įvadas į atviros XML failų formatus.
- Kiekvienoje sistemos Office programoje yra skirtingas įrankių rinkinys. Programos Word vartotojo sąsajos ir vykdomi procesai skiriasi nuo programos Excel arba PowerPoint vartotojo sąsajų ir procesų. Kodėl? Nes tai, kas veikia programoje Word, nebūtinai veiks programoje Excel ir t. t.
- Sistemos Office programos gali dirbti su kitų tiekėjų schemomis, transformacijomis ir duomenimis, jei XML yra tinkamai suformuota.
- Kai kurios sistemos Office programos naudoja XML fone, o kai kurios, pvz., Microsoft Office OneNote™, iš viso jos nepalaiko. Geriausias būdas sužinoti, kaip sistemos Office programa palaiko XML, yra paleisti internetinį tos programos žodyną ir ieškoti XML.
Kol kas viskas gerai, bet jei turite XML duomenis be schemos? Sistemos Office programos, kurios palaiko XML, turi savo būdų padėti jums dirbti su duomenimis. Pavyzdžiui, jei atidarysite XML failą programoje Word nepridėdami schemos, programa Word rodys žymes bei duomenis ir leis taikyti transformaciją, jei, pvz., ją pateikė failo kūrėjas arba jūsų IT skyrius. Blogiausiu atveju bent galėsite skaityti faile esančias žymes ir duomenis.
Programa Excel, kitaip nei programa Word, numano schemą, jei atidarote XML failą, kuris dar neturi schemos. Tada programa Excel pateikia parinktį įkelti šiuos duomenis į tik skaityti skirtą failą arba atvaizduoti duomenis XML sąraše (programoje Microsoft Office Excel 2003) arba XML lentelėje (programoje Office Excel 2007). Galite naudoti XML sąrašus ir lenteles norėdami rūšiuoti ir filtruoti duomenis arba pridėti prie jų skaičiavimus.
Office Professional 2007 ir Microsoft Office 2003 pateikia tokius pat XML įrankių rinkinius. Office Professional 2007 pirma turite įgalinti XML palaikymą, tada paleisti įrankius, esančius skirtingose vietose. Tačiau paleidus įrankius, jie veikia taip pat ir sistemoje Microsoft Office 2003, ir Office Professional 2007. Šie veiksmai paaiškina, kaip paleisti programų Office Excel 2007 ir Office Word 2007 XML įrankius.
Pastaba Numatyta, kad programa Microsoft Office Access 2007 įgalina savo XML įrankius, todėl naudodami programą Access, galite praleisti pirmuosius veiksmus.
XML įrankių įgalinimas programose Office Excel 2007 ir Office Word 2007
- Programoje Excel arba Word spustelėkite Microsoft Office mygtuką
, tada spustelėkite Excel parinktys arba Word parinktys, atsižvelgdami į šiuo metu atidarytą programą.
- Spustelėkite Individualizuoti.
- Dalyje Svarbiausios darbo su programos pavadinimas parinktys pažymėkite Juostelėje rodyti skirtuką Programų kūrėjas ir spustelėkite Gerai.
Pastaba Juostelė priklauso Vartotojo sąsaja „Microsoft Office Fluent“
XML įrankių paleidimas programose Office Excel 2007 ir Office Word 2007
- Bet kurios iš šių programų skirtuke Programų kūrėjas spustelėkite bet kurią galimą naudoti komandą, esančią grupėje XML.
XML įrankių paleidimas programoje Office Access 2007
- Spustelėkite skirtuką Išoriniai duomenys.
- Atlikite vieną iš šių veiksmų:
- Grupėje Importavimas spustelėkite XML failas.
- Grupėje Eksportavimas spustelėkite Daugiau ir XML failas.
Puslapio pradžia
Daugiau informacijos
Šiuose skyriuose esantys saitai nurodo informaciją apie XML naudojimą įvairiose Office programose ir apie XML kodo rašymą.
XML naudojimas „Office 2007“ leidimas
Pastaba Šiame skyriuje esantys saitai keisis, kai Office komanda sukurs ir publikuos daugiau turinio.
Įvadas į atviros XML failų formatus
XML naudojimas sistemoje Microsoft Office 2003
Pastaba Kai kurie šio skyriaus saitai nukreipia į Microsoft Office Online svetainę, o kai kurie į Microsoft kūrėjų tinklą (MSDN).
| Mokymas tinkle |
|
|
Bendra informacija
|
|
|
Access
|
|
|
Excel
|
|
|
FrontPage
|
|
|
InfoPath
|
- Kaip programa InfoPath naudoja XML technologijas
|
|
Visio
|
|
|
Word
|
|
XML kodo rašymas
- XML kūrėjų centras (MSDN)
Knygos apie XML
Pradedantiesiems
Programų kūrėjams ir IT specialistams
Puslapio pradžia