Helsingin yliopiston kirjasto, Suomen kansalliskirjasto
kansi   lukijalle   esipuhe   kirjoittajat   galleria


Kirja  tietoverkkojen maailmassa

 «

    aihepiirit    

  I  

  II  

  III  

  IV  

  V  

  VI  

» 
Haku päällä


Slaavilaisen kirjaston uusi elektroninen vetonaula
1 Aluksi
2 Velan vastikkeeksi
3 Uskomattomat tietovarannot
4 Haku päällä
5 Myös englanniksi
6 Lingvistinkin apuna
* Lähteet
tulosta Tulostettava versio
Tärkeä tekijä tietokannan käyttökelpoisuudessa on hakujärjestelmän monipuolisuus ja nopeus. Tämä on Integrumin eräs vahvuus. Haku voidaan kohdistaa yksittäisiin tietokantoihin, esimerkiksi tiettyyn sanomalehteen, tai aineistokategorioihin, esimerkiksi ”Lainsäädäntö”. Ajallinen rajaus voidaan luonnollisesti myös tehdä. Integrum, kuten myös yleiset venäläiset internet-hakukoneet, osaa taivuttaa haettavat sanat. Toisin sanoen, jos hakusanaksi kirjoittaa vodka, tulokseksi saadaan kaikki esiintymät, joissa kyseistä sanaa käytetään, siis perusmuodon ohella myös taivutusmuodot vodki, vodke, vodku, vodkoj jne. Tämä on erittäin tärkeä ominaisuus, koska venäjän kielessä on rikas taivutusjärjestelmä kuten kuusi sijamuotoa ja monimuotoinen verbitaivutus. Jos hakujärjestelmässä ei olisi tätä ominaisuutta, jokaista muotoa tulisi hakea erikseen. Toinen vaihtoehto olisi tyytyä perusmuotoon, jolloin esimerkiksi substantiiveilla jäisi arviolta 70-85% sanan käyttöesiintymistä löytämättä.

Mielenkiintoinen ja eräitten hakujen kannalta olennainen piirre on mahdollisuus määritellä, kuinka kaukana etsittävät sanat voivat esiintyä toisistaan. Tätä ominaisuutta voidaan käyttää esimerkiksi silloin, kun halutaan selvittää substantiivien yhteydessä käytettäviä prepositioita, muussa tapauksessa tarkastelun piiriin tulisivat vain sellaiset tapaukset, joissa prepositio on välittömästi substantiivin edessä ilman attribuuttia. Tätä tekniikkaa käyttäen voidaan selvittää, miten yksi sekä vakavia että huvittaviakin piirteitä saanut Venäjän ja Ukrainan välinen kielipoliittinen kiista näkyy lehdistön käytänteissä. Taustalla olivat ukrainalaisten protestit venäjän kielen normia vastaan koskien sanaa Ukraina. Kaikkien muiden maan nimien yhteydessä venäjässä käytetään prepositiota v (vrt. suomen ilmaus Ruotsissa), mutta Ukrainasta sanotaan na Ukraine (vrt. suomen Venäjällä). Ukrainalaisten mielestä tällainen preposition käyttö on halventavaa, koska historiallisesti voidaan tulkita, että preposition käytöllä viitataan jotenkin laitamaihin eikä itsenäiseen alueeseen. Tämän vuoksi he vaativat, että venäjän kielessä tulisi sanoa v Ukraine. Integrum-materiaalin avulla voidaan tarkkaan seurata, miten kielenkäyttö on kehittynyt tämän sanan osalta viimeisten kymmenen vuoden aikana eri lehtityypeissä: Moskovassa ilmestyvät lehdet, aluelehdistö, Ukrainassa ilmestyvät lehdet, muualla IVY-maissa ilmestyvät lehdet. (Vrt. Smoljanskij 2003).

Suomalainen ei voi olla testaamatta maahamme liittyvien sanojen esiintymisiä. Tarja Halonen esiintyy materiaalissa 7000 kertaa. Mielenkiintoista on katsoa, mitä hänestä kirjoittaa esimerkiksi Rybak severa (Pohjoisen kalastaja). Matti Vanhasesta on ennättänyt olla vasta 120 mainintaa. Entä sitten sana Finljandija? Se esiintyy yli 400 000 kertaa. Suurin osa esiintymistä liittyy tietysti normaaliin uutismateriaaliin. Jotakuta saattaisi kuitenkin kiinnostaa, mitä Suomesta sanotaan Venäjän korkeimman oikeuden tiedotteissa (7 esiintymää), duuman istuntojen pöytäkirjoissa (47), patenttikuvauksissa (yli 500) tai se kenen kirjailijan teoksissa esiintyy sana Finljandija (pari sataa esiintymää).

Sauna tietysti kiinnostaa meitä. Vaikka professori Igor Vahros osoitti jo vuonna 1966 suomalaisen ja venäläisen saunan yhteiset sukujuuret, venäläiset edelleen uskovat, että venäläinen sauna (banja) ja suomalainen sauna (venäjäksikin sauna) ovat ihan eri käsitteitä. Edellinen on heidän mukaansa se perinteinen maalaissauna, jossa heitetään löylyä, ja jälkimmäinen on kuiva sähkösauna. Näkyykö tämä sitten jotenkin näiden sanojen käytön jakaumassa? Eri aineistoja koskevat luvut ovat hämmästyttävän samanlaiset. Lähes kaikissa materiaaleissa, niin erilaisissa lehdissä kuin lainsäädäntöonkiin liittyvissä teksteissä, sana banja on 2-4 kertaa yleisempi kuin sauna kokonaismäärien ollessa 184000 ja 73400. Mielenkiintoisen osan esiintymistä (noin 1000) muodostavat sellaiset lauseet, joissa esiintyvät molemmat sanat. Pikainen silmäys niihin osoittaa, että sanoilla useimmissa tapauksissa todellakin tarkoitetaan eri käsitteitä. Hakemistossa Venäjän poliittinen eliitti seitsemän miestä ilmoittaa harrastuksekseen saunomisen. Viisi heistä käy banjassa, yksi saunassa, yksi käy molemmissa. Yhdestä poliitikosta kerrotaan, että hänestä on julkaistu kuva, jossa hän on yhdessä alastomien naisten kanssa saunassa. Tuskin olisi ollut mahdollista, että lehdessä olisi julkaistu vastaava kuva banjasta.

Yllä olevat esimerkit ovat luonnollisesti vain pintapuolista leikkiä numeroilla ja yksittäisillä esimerkeillä. Joka tapauksessa ne osoittavat joitakin mahdollisuuksia käyttää tietokantaa.


«  1  2  3  4  5  6  *  »
URN:NBN:fi-fe20031613