ADATKERESÉS

Az elôzô fejezetben tárgyalt adatbázis felhasználás elsôsorban a navigálásra, a kérdôív szerkesztésre és a böngészésre öszpontosított. Az adat keresés jelenti azt a folyamatot, amely során nagy mennyiségű adathalmazt nézünk át azzal a céllal, hogy szignifikáns összefüggéseket találjunk az egyényi adatok között és ezekbôl a megfigyelésekbôl jósló tulajdonságú szabályokat hozzunk létre. Tudósok hatékonyan tudnak dolgozni néhányezer megfigyelés alapján, úgy hogy az egyes megfigyeléseiket kis számú kísérletekre alapozzák.Tíz vagy száz mérésbôl származó többmilliós adatpont halmaz hatékony feldolgozása egy más dolog. Számos technikát használunk az adatkeresésre: hipotézisek felállítása és igazolása; érdekes módszerek utáni ellenôrizetlen globális keresés ; ellenôrzött, célirányos keresés és az adatok összefüggéseinek grafikus megjelenítése. Mivel a változó tér gyakran nagyon magas dimenziójú és az eredmények mint pl. a döntési fák (decision tree) szerkezete nagyon elágazó az adatkeresés találatainak meggyôzô megjelenítése igen nagy jelentôséggel bír. A fáknak, szabályoknak és evidens alakzatoknak (evidence pattern) a járható 3 dimenziós szerkezete nagyon hasznosnak bizonyult az ilyen típusú felhasználásban. Azokat a fákat, amelyek nagyobbak annál, hogy olvasható formában egy papírra ki lehessen nyomtatni, nehéz a hagyományos 2 dimenziós formában megnézni ill. használni. Az adatkeresés a kémia egy olyan területe, amellyet csak most kezdenek szisztematikusan kutatni, bár elég tágak a lehetôségek. Sok cég rendelkezik kiterjedt adathalmazzal, ami pl. a gyógyszerfejlesztésből eredő QSAR tanulmányokból származik. Mostanáig ezek a QSAR tanulmányok hasonló vegyületek kis adathalmazaira korlátozódtak. A rendelkezésre álló számítógépes teljesítmény és  a kereső algoritmusok fejlődésével az évek során összegyült adatok újraértékelése kilátást biztosít arra, hogy az eddig észre nem vett rendszereket (pattern) felfedezzék. Ez különböző eljárások (project) újraéledését vonja maga után elvezetve olyan területekhez, amelyeket az eredeti munkánk során nem tanulmányoztunk. Egy másik igéretes felhasználási terület a DNS ésRNS szekvencia analízis. A virtuális valóság környezetek, akárcsak az új nem bemerülő képernyő metafóra (non-immersive display metaphors) hatékony ezközei a keresési műveletek ellenőrzésének és irányításának

A SANDBOX (Scientists Accassing Necessary Data Based On eXperimentation)  rendszert egy általános célú interface-ként tervezték, mellyel nagy mennyiségű táblázatos adatokat tartalmazó adatbázisokat lehet elérni. A SANDBOX egy virtuális valóság ezköz, amely lehetővé teszi a felhasználó számára, hogy felépítse az eredeti kísérleteket különböző adatbázisokból gyűjtött adatokkal oly módon, mint ahogy az eredeti adatokat gyűjtötte. A felhasználó virtuális ezközöket helyez el egy környezetben és kérdőív kitöltése nélkül gyűjti össze az adatokat tudományos adatbáziokból. A műszerek visszajeleznek (feedback) lehetővé téve a felhasználó számára, hogy az adatok között böngésszen. Bebizonyították  táblázatok százait tartalmazó adatgyűjteményen, hogy több mint 100 gigabájtnyi adatot és vituális anyagot (pl. térképek, mellyek a virtuális valóság megközelítései) a teszt fehasználó tudósok természetes és hatékony tényként fogadtak el.

Egy másik rendszer hasonló felhasználási területtel a Virtuális Adat Megjelenítő (VDV) 79. A VDV-t nagyfokú interaktivitás, az adatok analízisének megjelenítésére szolgáló térbeli környezet jellemzi, ami nem feltétlenül specifikus adatokra irányul. Az adatokat gif elemként jelenítik meg, mellyeket a felhasználó készíthet, cserélhet ill. törölhet a munkaasztalon. Ezt a rendszert már használták kémiai adatok analízisére pl. molekulák dinamikus mozgásának megjelenítésére és ellenőrzésére a csopot/felület ütközési kölcsönhatásokban.