Tillbaka till start   Kapitel 10   Kapitel 12  

Miguel Benito

 

KAPITEL 11

 

SPRÅKKONTROLL

 

 

 

Varje indexeringssystem kan ha egna regler för hur man skall an­vända språ­ket. In­dexeringsspråk defi­nieras som samlingen av alla de ord som används antingen för att beskriva ett specifikt doku­ment, eller för att bygga upp en fråga för att återfinna en grupp av dokument. Indexeringsspråket innehåller regler som be­skri­ver hur ter­mer­na skall användas och vilken rela­tion termer­na har med var­andra.

 

Indexeringsspråk kan indelas i många olika grupper. Den främsta upp­delning­en är dock mellan två kategorier av indexeringssystem:

 

1) system som enbart använder härledda termer (derived terms).

 

Härledda termer, eller utdragna termer, innebär att man använder de ord som förekommer i publika­tionen, i första hand ord i titeln, men också i referat, innehålls­förteckning etc. om des­sa också indexeras. Den stora för­delen med här­ledda termer är att in­dexeringen kan gå ganska fort, eftersom den i stort sett kan göras helt me­ka­niskt genom att regi­strera titeln, referaten och innehållsförteckning­en så­som de är och sedan låta en datamas­kin göra i ord­ning indexet.

Ett bra exempel är de indexeringssystem som bygger på KWIC. Vissa regler måste dock iakttas. En nackdel  med dessa system är att man är helt beroende av de termer som författaren använt, vilket betyder att litteratur indexerad på sam­ma ord inte nödvändigtvis be­höver handla om samma ämne eller att litteratur i ett och sam­ma ämne kan finnas under olika termer. Ex.

 

  "Städning av offentliga lokaler"

   sökes under termen "städ­ning"

  "Lokalvård på offentliga lokaler"

   sökes under termen "lo­kal­vård".

  "Städning pågår bland chefer inom förvaltning­en"

   sökes under termen "städning", fast med annan bety­delse än den man i första hand tänker sig.

 

En annan nackdel med termer hämtade ur titeln är att viss litteratur inte går att indexera ö­verhuvud­taget. Som exempel titeln: "Hur var det förr?"

 

Generellt kan man säga att härledda termer används mest inom tek­nik och na­turve­tenskap. Där åter­speglar titlarna ofta innehållet i publikatio­nen ganska ex­akt, medan man använder systemet mycket min­dre inom humaniora och sam­hällsvetenskap. Där kan  titlarna vara ganska fanta­si­fulla och ha en svag an­knyt­ning till bokens innehåll. Det andra använd­ningsområdet är när man indexerar hela tex­ten, som i TTs nyhets­bank.

 

2) system som använder tilldelade termer (assigned terms).

 

Tilldelade termer innebär att indexeraren själv analy­serar vilket eller vilka äm­nen som publika­tionen hand­lar om och bestämmer vilken eller vilka termer som publi­kationen skall indexeras på. Indexeraren har i det här fallet större möjlig­het att fastställa dokumentets innehåll, eftersom han eller hon inte är bunden till dokumentets titel, innehållsförteckning, abstract, utan själv kan bedöma innehål­let genom att läsa förordet, sammanfattningen, recensioner, bläddra i publikatio­nen eller rådfråga specialister. Tilldelade termer kan häm­tas på två olika sätt:

 

a) genom fri vokabulär.

 

Fri vokabulär innebär att indexeraren väljer den för tillfället mest läm­pliga termen utan att man i förväg gjort upp vilka termer som skall användas. En fördel med sys­temet är att man snabbt kan fånga in nya be­grepp. Nackdelen är att man vid sökning måste söka på olika termer för att vara säker på att man fått all litteratur. Ex. från ovan om städning och lokalvård. En indexerare regi­strerar t.ex. 5 publ­ika­tioner under ter­men "städning", en annan indexerare regi­strerar ytter­li­gare 5 publi­katio­ner under termen "lokalvård", en tredje kan­ske väljer termen "rengöring" o.s.v. När man sedan skall söka i sys­temet är risken stor att man bara kan återfinna en del av litteratu­ren. Vet man att sys­temet bygger på fri vokabulär, så vet man att man måste söka på alla möjli­ga termer som betyder samma sak. På det viset elimi­nerar man den risk som nämns ovan. Skill­naden mellan användningen av fri voka­bulär och härledda ter­mer behöver inte vara särskilt stor.

 

b) genom kontrollerad vokabulär.

 

Kontrollerad vokabulär innebär att man i förväg har bestämt sig för vilka ter­mer man skall få använda vid in­dexeringen. I sådana fall har man ett regis­ter över de termer som gäller. Den största fördelen är att alla indexerare i princip använder sig av sam­ma term för att indexera publikationer med ett visst inne­håll. Detta under­lättar vid sökningen, eftersom den kan göras ef­fek­tiv. Listan måste naturligtvis från tid till an­nan revideras och kompletteras. En vanlig sådan är den som kallas "tes­aur­us". För att riktigt kunna kalla en lista för tesaurus måste dock vissa villkor upp­fyllas. Hur en tesaurus ser ut skall vi titta på litet längre fram.

 

Några regler att tänka på:

 

Kontrollerad vokabulär kan åstadkommas med relativt enkla regler. Några av reg­lerna gäller även för index som bygger på fri vokabu­lär. De viktigaste är:

 

1) Konsekvens vid användningen av singularis och plura­lis. Huvud­re­geln är att konk­reta föremål söks med ord i pluralis medan discipliner, ab­strakta be­grepp, verksam­heter och processer söks i singu­laris, t.ex.

    bilar, möbl­er, filo­sofi, städning, jäs­ning.

 

Om namnet på konkreta föremål eller material svarar på frågan "hur mycket?" och inte "hur många?" använder man sig av singularis. Ex.

    ånga, bensin, olja, tyg

När ordet uttrycker flera olika sorter ("hur många?") blir det pluralis:

    oljor, ty­ger, metaller

 

Ett ord kan också ha olika betydelser i singularis och pluralis. Ex.

    re­li­gion (äm­net som så­dant)

    religioner (de olika religionerna)

 

Likaså kan pluralis användas i de fall där abstrakta begrepp re­presente­rar en kate­gori som består av flera enheter. Ex.

    kemiska reaktioner, sociala frågor

 

2) Använd obestämd form som regel. Om termen uttrycker något unikt som det bara finns ett av den sorten, kan be­stämd form förekomma. Ex. "solen". Även ab­strakta be­grepp kan uttryckas i bestämd form. Ex. "förnuftet".

 

3) I större indexeringssystem förekommer termer som skrivs lik­adant men som har olika betydel­se, "homogra­fer", också kallade homonymer. I sådana fall mås­te man komplettera termerna med en precisering om vilken be­tydelse de har, inom paren­tes, eller på annat sätt. Ex.

    Ben (skelett)

    Ben (extremiteter)

 

Även ord som har samma grundbetydelse, men får olika innebörd be­roende på vil­ket ämnesområde de används i, behandlas på samma sätt:

    Fält (data)

    Fält (elektricitet)

    Fält (lantbruk)

 

4) När det gäller synonymer måste man bestämma sig för vilken term som skall gälla som sök­term. Man skall försöka välja den term som används mest, och som de flesta är förtrogna med. Övriga termer skall också fin­nas med, men med hänvisning till den använda termen. T.ex.

    Städning se Lokalvård

 

Det finns olika typer av synonymer.

 

Ord som har olika ur­sprung, t.ex.

    lantbruk vs. jordbruk

    

Äldre och nyare termer   

    blinda vs. synskadade

    städare vs. lokalvårdare

 

Vetenskapliga och icke-vetenskapliga termer

    zoologi vs. djurlära

    fonogram vs. musikskiva

 

Låneord och översättning på det egna språket

    diskett vs. skiva

      

En produkt och ett företagsnamn 

    fotokopia vs. xerox

 

I fall det är fråga om fri vokabulär kan man också ha nytta av korshän­vis­ning­ar:

    Städning se även Lokalvård,

    Lokalvård se även Städning o.s.v.

 

5) Antonymer är termer som står för motsatt betydelse. I vissa fall kan det vara läm­pligt att ha dem tillsam­mans och bilda en indexeringsterm. T.ex. 

    Inflation och defla­tion

    Ebb och flod

    Ar­bete och arbetslöshet

 

6) Akronymer är förkortningar som används som riktiga namn, efter vilka in­stitu­tio­ner och verksam­heter är kända, t.ex. Unesco, Nor­dinfo. En hänvis­ning från det riktiga namnet görs. När det gäller vanliga för­kort­ningar rekom­mende­ras att använ­da det riktiga namnet som sökterm och hänvisning från förkort­ningen. Ex.:

    United Nations Educational, Scientific and Cultural Organisa­tion

    Se Unesco

men

    SJ se Statens Järnvägar

 

Det finns förkortningar som inte längre uppfattas som sådana, utan har inkor­pore­rats i språket, t.ex.

    radar, aids, laser

 

7) På svenska synes det inte behövligt att särskilt fun­dera över termer som kan stavas olika, eftersom det finns ganska få sådana. På andra språk där­emot kan det vara viktiga­re. Ex­empel från engelska och amerikan­ska: Cen­tre och Cen­ter. Sam­ma sorts s­tav­ning bör använ­das över hela syste­met.

    kafé eller café

 

8) Det är viktigt att använda så specifika termer som möjligt, t.ex.

    ång­pannor och inte pannor

 

9) Det är som regel bättre att välja vardagliga uttryck och termer fram­för veten­ska­pliga, om inte sys­temet an­vänds enbart av specia­lister, t.ex.

    djurlära i stället för zoo­logi

 

10) Använd inverterad ordning mellan ord som ingår i ett sammansatt begrepp om de andra orden förutsätts vara intressantare. T.ex.

    sociologi, marxistisk

    indexering, koordinerad

 

11) När två termer förbinds med "och" och det markerar en viss relation mel­lan dem, behåller man samma ord­ning, t­.ex.

    kristendom och politik

    vetenskap och historia

 

12) Använd substantiv. Adjektiv- och verbform kan före­kom­ma vid index­ering, men då med substantiviserad be­tydel­se:

    kollektivanslutna

 

13) Personnamn skrivs ut enligt samma regler som gäl­ler för person­namn som upp­slag i katalogen:

    Homeros

    Cicero, Marcus Tullius

    Cervantes Saavedra, Miguel de

 

14) Institutions- och kongressnamn skrivs ut enligt samma regler som gäller för katalo­gise­ring:

    Arbetsmarknadsdepartementet

    Statens industriverk

    Lunds universitet. Pedagogiska institutionen

    Nordiska biblioteksmötet (6 : 1950 : Uppsala)

 

15) Geografiska namn skrivs ut i enlighet med reglerna för katalogisering:

    Cambridge, Mass.

    Santo Domingo de Silos (Spanien)

 

Enkla och sammansatta begrepp

 

Enkla begrepp kan uttryckas med ett ord, som bibliotek, lantbruk, men de kan ock­så bestå av två eller flera ord, som

    Teknisk fysik, Ren luft

 

Sammansatta begrepp kan även de uttryckas med ett eller flera ord. Skillna­den är dock att de enkla begreppen som ingår i de sammansatta begreppen var för sig och i någon form av kombination kan vara sökbara. T.ex.

    Bib­li­o­teksutlå­ning

 

Man kan skriva som det står, men man kan också skriva

    Bibliotek

     - utlåning

eller

    Utlåning. Bibliotek

Eller

    Utlåning på bibliotek

som en fras

 

Viktigast är att man väljer en teknik som sedan används inom hela systemet.

Bindestreck uttrycker ofta en precisering eller av­gränsning av den föregående termen. När man bygger upp ett indexerings­system väljer man samtidigt på vilket sätt de sammansatta begreppen skall skrivas ut.

 

Att bygga upp en termlista

 

Så länge man bygger upp ett system kan behovet av en kon­trollerad voka­bulär synas vara litet. Alltefter­som det växer kan dock svag­heterna kom­ma fram. Vad det hand­lar om är att man aldrig är säker på termernas betydelse om man inte har en fast­ställd termlista. Men eftersom för­de­larna med fri vokabu­lär också är stora, framför­allt snabbheten vid in­dexeringstillfället, så arbetar man idag med att hitta former för att före­na båda sakerna: fria termer, men med vissa minimireg­ler som innebär att det ger näs­tan samma resultat som om man använde kon­trolle­rad voka­bulär.

 

Att bygga upp en termlista

 

Det finns två olika sätt att bygga upp en termlista. Det ena kal­las för "deduk­tiv me­tod" och det andra  "in­duktiv metod".

 

Deduktiv metod innebär att man först samlar in alla tänkbara ter­mer inom det äm­nesområde som in­dexet skall täcka och sedan ordnar dem i klasser och under­klas­ser. Detta görs för att man skall kunna överblicka alla indel­ningsmöjligheter som kan finnas, obero­ende av om det finns doku­ment som kan in­dexe­ras med dessa termer eller ej (ovanifrån och ne­råt). UDK som klassifi­kationssystem är ett typexem­pel på de­duktiv metod.

 

Induktiv metod innebär att man utifrån en enkel struk­tur i klasser och under­klasser sätter in nya ter­mer allt efter som de förekommer i den littera­tur man in­dex­e­rar (nerifrån och uppåt). Dewey‑­systemet och SAB:s äm­ne­sordsregister är exempel på induktiv metod.

 

Hur många termer får man använda för att beskriva ett dokument?

 

Vissa indexeringssystem är uppbyggda så att man redan från början bestämt sig för att avgränsa antalet termer till tre, på samma sätt som det idag gäller för klas­si­fikationssystem som SAB eller UDK. Andra system be­grän­sar sig till fyra termer. Ytterligare andra, som SCANP, tillåter upp till 20 olika termer. Verklig­heten brukar dock begränsa möjligheterna. Därför är det bät­tre att man bygger upp ett system utan begränsning av an­tal termer.

 

För– och nackdelar med kontrollerat språk

 

Fördelar:

 

– Kontroll av synonymer

– Man kan ha förklaringar till termerna (SN)

– Man hänvisar till andra överordnade, un­derordnade och närbesläktade termer,

   om de är relevanta för sökningen

– Syntaktiska problem kan minimeras, bl.a. genom att man kan bilda samman-

  ­ satta be­grepp

– Man kan bestämma graden av precision

 

Nackdelar:

 

– Man når ofta mindre specificitet och mindre uttömman­degrad

– Det kostar mera att indexera

– Inte alltid aktuell, det tar tid för nya begrepp att kom­ma in i systemet

– Ofta är termerna andra än de som används i ett annat system, och

   forskarna måste tänka om varje gång de söker

 

För– och nackdelar med naturligt språk

 

Fördelar:

 

– Hög grad av specificitet och precision

– Det är möjligt med högre uttömmandegrad, bl.a. genom att i prin­cip

   hela boken kan indexeras, inte bara titeln

– Termerna är aktuella, de är desamma som författarna och även forskar­na

   själva använder vid den tidpunkten

– Låg kostnad

– Lätt att flytta informationen mellan databaserna

 

Nackdelar:

 

– Forskaren måste jobba mera vid sökningstillfället för att nå en någorlunda

   tillfredsställande återvinningsgrad

– Det kan förekomma syntaktiska problem

– En mycket hög uttömmandegrad kan ändå leda till brist på preci­sion

 

LITTERATUR

 

Austin, Derek, PRECIS : a manual of concept analysis and subject in­dexing. - 2. ed. - The British Library, 1984.

 

Cleveland, Donald B., Introduction to indexing and ab­stracting / Do­nald B. Cleve­land, Ana D. Cleve­land. - 2. ed. - Libraries Unlimited, 1990.

 

Indexers on indexing / edited by Leonard Montague Har­rod. - Bowker, 1978.

 

Ramsden, Michael J., An introduction to index language construction. - Bing­ley, 1974.

 

Rowley, Jennifer E., Abstracting and indexing. - Bing­ley, 1982.

 

Wellisch, Hans H., Indexing from A to Z. - Wilson, 1991.

 

 

 


© 2001-2009, Miguel Benito
Tillbaka till kunskapsorganisation
Tillbaka till hemsidan
URL: http://www.taranco.eu/
E-post: miguel.benito /@/ taranco.eu