Forditotta és átdolgozta a "Publishing Chemistry on the Internet" szerint

 

4. Kémiai témákra kifejlesztett programnyelv

 

4.1. Bevezetés

 

A kémia tárgya és technikája óriási területet fed le, ezért nem meglepô, hogy különbözô adatfájlok közötti információcsere bonyolult, mitöbb mindenkinek megvan a saját, többé-kevésbé különbözô szemlélete az olyan fogalmak jelentésérôl, mint például kémiai kötés, vegyérték, képlet stb. A hagyományos megközelítés az volt, hogy vagy szabványosítják ezeket az adatfájlokat mint pl. chemical/x-pdb, vagy konvertáló programok írnak (pl. Babel). Sajnos ez utóbbi megoldás sokszor információvesztéssel jár (pl: az MDA Molfiles nem tartalmaz bibliográfiát).

Ennél is komolyabb probléma az információ tartalom csökkenése (legacy information decays). A ma alkalmazott formátumok 5 év múlva valószínüleg értelmezhetetlenek lesznek. Sok formátum ma sem szabványos találgatással vagy szájhagyomány utján lehet használni..

Manapság általánosan elfogadott, hogy a fenti problémák áthidalását csak egy jelölö nyelvvel lehet megvalósítani. Ez a nyelv egy ún. meta-információt csatol a dokumentumhoz abból a célból, hogy az olvasó több információt nyerjen, pl: egy ember "tudja", hogy a címnek a dokumentum elejére kell kerülnie, de a számítógépek nem, ezért szükségük van egy olyan utasításra, mint az alábbi:

<TITLE> The Nature of the Chemical Bond </TITLE>

<AUTHOR> Linus Pauling </AUTHOR>

Ha a dokumentumok ilyen formában vannak megirva, akkor kereséskor és indexeléskor óriási lehetôségek nyilnak meg a felhesználó elôtt. Ugyanakkor ezáltal teljesen kiküszöbölik a bizonytalanságokat és a félreértelmezéseket.

A leggyakrabban használt szabvány az SGML (Standard Generalised Markup Languages). Az SGML olyan nyelvek szabványa, mint pl: HTML. A HTML az SGML egy alkalmazása vagy másképp kifejezve egy "Dokumentum Tipus Definálása" (DTD -Document Type Definition). Az SGML keretén belül két fontosabb kezdeményezés indult, a világirodalom (Text Encoding Initiative - TEI) és a zene SMDL (Standard Music Description Language) adatbázis-szabványainak kialakítása. A CML (Chemical Markup Languages) is hasonló kezdeményezésbôl született. A kémia felöleli a csillagközi teret, az ásványok felosztását, a szerves molekulákat, a proteineket, a nanotechnológiát és sok más egyebet. Ahogy Demokritosz mondta: "Semmi sem létezik az atomokon és az üres téren kívül, minden más csak feltevés". Csakhogy éppen a feltevéseket nehéz szigorú korlátok közé szorítani. A CML fejlesztésében a sikert a szigor és a alkalmazkodás megfelelô arányú keveredése biztosítja. Ezért a CML fejlesztése nyilvános folyamat sok különbözô vélemény figyelembevételével, hasonlóan más informatikai eszközök kifejlesztéséhez.A CML kialakitását az Open Molecule Foundation nonprofit szervezet támogatja .


A CML a következô problémákat oldja meg:


A CML három részbôl áll:

Egy tipikus példa a CML nyelvezetre:

<X.VAR TITLE="Heat of Formation" REL = "Glossary"

HREF="/Chm/Theor?Deltahform" UNITS= "Kilocalorie/Mol">12.34</X.VAR>

A CML dokumentumok szerkezete nagyon rugalmas, alkalmazásuk az alábbi területeken történik:

 

4.2. Fejlesztési irányvonalak

Akármilyen egyszerű is legyen egy dokumentum, mint pl: egy rövid kommunikáció, a szekezete leírható egy DSSSL (Document Style Semantics and Specification Language) megközelítéssel. A Joe English által írt CoST egy olyan eszköz, amely a dokumentum teljes szerkezetét képes többféleképpen manipulálni:

Ezáltal forradalmasítani tudja azokat a szempontokat, amelyek alapján egy vegyész az információt kezeli. A CML ugyanakkor biztosítja a folyamatosan felfrissített laboratóriumi jegyzôkönyvek információbôségét, amelyek így már "jövôbiztossá" és kereshetôvé válnak. A legtöbb esetben az adatok jobban rendszerezettek a CML-ben mint beerôszakolva egy ún. relacionális formában. Ez annak köszönhetô, hogy a CML alátámasztja azt a módot, ahogyan egy tudós, vagy kutató gondolkozik. A CML dokumentumok tárgyköre nagyon nagy területet fed le. Ennek ellenére olyan eszközök, mint pl: a CoST lehetôvé teszik egy komponens automatikus megkeresését a szövegbôl egy másik alkalmazás számára. Ezzel megoldották, hogy egy publikációban megjelentett adathalmazt, "életre lehessen kelteni".

 

4.3. Együttműködés

A CML csak kiindulási alapként tekintendô, és igazán akkor fog fejlôdni, ha sokan lesznek azok, akik akár csak csekély hozzájárulással is, de továbbépítik, pl: ha a program- és műszerfejlesztôk az adatkimenetüket a CML szerint szerkesztik meg. Ekkor olyan műveletek, mint az ábrázolás, számítás, editálás mindenfáradság nélkül elvégezhetôek lesznek. Máris rendelkezésre állnak ilyen eszközök, lásd az OMF ottlapot.