Kui „tark“ peab olema e-kataloogi otsingumootor.

By | 15.02.2009

Arendades RIKSWEB kataloogile uut otsingumootorit, tekkis idee, vahetada oma mõtteid ja seniseid kogemusi, teemal, kui „tark“ peab või võiks olla tänapäeva e-kataloogi otsingumootor.

Otsingute sooritamine on e-kataloogi enimkasutatud funktsioon lugejate poolt. Tarkvaraarendajana tuleb tihti mõelda samal tasemel, nagu seda teeb keskmine e-kataloogi kasutaja. Keskmise kasutaja all mõtlen eelkõige kasutajat, kellel puudub spetsiifiline raamatukogunduslik taust ja teadmised erialastest standarditest. Raamatukogutöötajad on kindlasti kokkupuutunud lugejatega, kes väga „omapäraseid“ kirjeldusi raamatuid soovides annavad. Täiesti vahetatud sõnad pealkirjas või autori nimes, rääkimata soovist : „Palun mulle seda punaste kaantega raamatut“. Mida teha, kui käepärast ei ole kogemustega raamatukogutöötajat, kes tihtipeale selliste kirjelduste alusel kohe õige raamatu lugejale ulatab? Kas otsingumootor peaks tagastama tulemuse, kui lugeja otsib – „punaste kaantega raamat“?

 

Erinevad otsivõimalused

Tänapäevased e-kataloogid võimaldavad kasutada väga erinevaid tingimusi ja piiranguid otsingute sooritamiseks. Näiteks otsingud pealkirja, autori ja märksõnade alusel. Samuti eelmainitud tingimuste kombineerimine, kasutades erinevaid loogikaoperaatoreid (ja, või, mitte jne.) Olles teinud natuke statistikat RIKSWEB kasutamise kohta, olen jõudnud järelduseni, et mida rohkem on erinevaid võimalusi otsingute sooritamiseks, seda vähem neid kasutatakse. Miks nii? Otsest vastust siin vist ei olegi. Alati võib ju väita, et kasutaja on laisk või ei oma piisavalt teadmisi. Teisalt – kas peakski? Loomulikult ei saa ära jätta eelmainitud kombineerimise võimalusi, sest kataloogi võivad kasutada ka väga heade erialaste teadmistega inimesed, kes teavad täpselt, mida nad otsivad ja eeldavad ka vastavat tulemust.

 

Mida otsib „keskmine“ kasutaja

Arvake, mitut sõna otsingus enamasti kasutakse? Õige vastus – ühte! Kui seda ühte sõna kasutatakse teadlikult, kindla tingimuse või piirangu puhul, olgu selleks näiteks autor, ei ole tulemus väga hull. Keerulisem on lugu märksõnade ja vabasõna otsingul, kui tegemist ei ole erialaste sõnadega. Raamatukogus, kus fondi suurust võib mõõta kümnete tuhandete kirjetega annab ühesõnaline otsing praktiliselt kasutu tulemuse. Oletame, et kasutaja otsib sõna „eesti“ – otsingutulemuse vastusest ei ole siin mõtet rääkidagi aga tihtipeale just selliseid otsinguid keskmised kasutajad sooritavad.

    

Mida kasutaja tegelikult soovis leida?

Võtame teemat natuke spetsiifilisemalt ja kitsendame otsingut autori järgi. Kataloogimise standard näeb isikunimede kataloogimisel ette järgmist formaati – perekonnanimi, eesnimi. Keskmine kasutaja seda ei tea ega peagi teadma. Statistika näitab, et kasutades otsingut autori järgi, on otsitav tekst just vastupidi – eesnimi perekonnanimi. Kasutaja jaoks arusaadavalt loogiline ja üheti mõistetav, tema sisestas raamatu autori nime ja soovib tulemusena sisestatud autori teoseid. Seega peaks otsing andma tulemuse, olenemata sellest, millises järjekorras nimed on sisestatud. 

Natuke keerulisem teema on otsing teaviku pealkirja järgi. Pealkirjas olevate sõnade ja nimede järjekorda kataloogimisel ei muudeta. Aga kuidas toimida, kui kasutajad on sõnade järjekorra sassi ajanud või ühe sõna sootuks teisega asendanud? Võtame reaalelulise näite pealkirjaga „Musta pori näkku“, kuid kasutaja otsib pealkirja „Musta muda näkku“. Segi on aetud sõnad pori ja muda, üsna inimlik kas pole? Kas selline otsing peaks tulemuse andma? Kui jah, siis millise? Esitades selle küsimuse raamatukogutöötajatele langevad nende arvamused lahku. Ühed arvavad, et otsing ei peaks andma tulemusi ja kasutajat peaks teavitama, et sellise pealkirjaga teoseid ei leidu. Teised arvavad, et tulemus peaks kindlasti olema ja välja pakkuma kõik sarnased pealkirjad. Lähtudes „inimlikust“ arusaamisest on antud ülesande lahendamine lihtne, eriti raamatukogutöötajatel. Kuidas peaks tarkvara asja lahendama ja aru saama, et muda=pori? Kas pori on muda sünonüüm? Ma ei ole küll kursis kas üheski tänapäeva raamatukogusüsteemis kasutatakse sünonüümide sisestamist või algoritme, mis neid võrdlevad. Tegelikult saab ka lihtsamalt ja antud otsingu puhul RIKSWEB ei arvesta lihtsalt seda sõna, arvesse lähevad ainult kokkulangenud sõnad ja seega otsing annab kindlasti tulemuse, iseasi kas õige pealkiri on otsingutulemuses just esimene. 

Järgmiseks üritab kasutaja pealkirja järgi otsida – „pori näkku musta“. Kuidas sellisele otsingule reageerida ja vastata? Iseenesest on reaalse teose pealkirjas kõik sisestatud sõnad olemas, küll aga hoopis teises järjekorras. Viimane RIKSWEB versioon vastab sellisele otsingule positiivselt ja kuvab esimeste hulgas ka õige pealkirja „Musta pori näkku“.

 

Milleks üldse otsing pealkirja või autori järgi?

Kui otsing segamini aetud sõnadega pealkirja või autori järgi annab õige tulemuse, milleks üldse siis neid vaja on? Piisaks vabasõna otsingust ja tulemus oleks sama? Vastus on jah ja ei. Lihtsamalt seletades – otsides kindla tingimuse (MARC välja) järgi, on otsing vähem ressurssi nõudev ja vastuse kombineerimine lihtsam. Kasutades ainult vabasõna otsingut, ehk otsingut kõikide väljade järgi on müra tase mitmeid kordi suurem. Õnneks on selliseid kirjeid vähe, kus pealkirjas olevad sõnad on dubleeritud ka autori nimes, märksõnades ja/või teistel väljadel.

 

Kokkuvõtteks

Võib öelda, et e-kataloogi otsingumootoris kasutatakse enamasti vabasõna otsingut ehk avalehel olevat „kastikest“, kuhu kasutaja soovitud sõna(d) sisestab ja sellest piisab. Kogenumad kasutavad detailsemat otsingut soovitud välja alusel. Alati on võimalus otsingumootorit targemaks ja paremaks teha, kuid RIKSWEB viimane versioon peaks rahuldama nii keskmise kui ka kogenud kasutaja otsingusoovid, et õige ja soovitud tulemus saada.

Head otsimist!

Lisa kommentaar