Catalogusverrijking,verbeteren van onderwerpszoeken
pagina gestart door Jeroen, project van Jikke
feel free to add/comment!
Inleiding
De catalogus is de belangrijkste ingang voor het vinden van gedrukte publicaties in de UBU bibliotheken. De known-item search daarin gaat doorgaans zonder al te veel moeite. In praktijk blijkt echter met name het op onderwerp vinden van publicaties vrij lastig. Dat komt doordat:
- er per record vrij weinig inhoudelijke tekst beschikbaar is die geïndexeerd kan worden
- onderwerpsontsluitingssystemen onvolledig zijn of inmiddels niet meer worden bijgehouden
- het voor studenten moeilijk is van een vrij specifiek onderwerp te abstraheren naar termen die voor zouden kunnen komen in titelbeschrijvingen van boeken
- de zoekmethode niet aansluit op zoekmethodes die door andere, bekendere zoekmachines (bv Google) worden gebruikt
Het gevolg is dat gebruikers vaak niet kunnen vinden wat ze zoeken, en ook niet weten of ze alles gevonden hebben wat er binnen de UBU aan relevante literatuur is. Een ander bijkomend punt is dat veel boeken nooit worden geleend, waarbij onduidelijk is of dat dit komt omdat de boeken niet interessant zijn, of omdat ze niet gevonden worden.
Het doel is uiteraard een betere zoekervaring voor onze gebruikers en een hogere gebruiksgraad voor onze boeken.
Meer algemeen: dit is niet iets waar wij alleen naar kijken. In de VS is onlangs een zeer zware commissie voor de toekomst van bibliografische beschrijving in het leven geroepen die voor november 2007 gaat adviseren.
Het meest duidelijke en kernachtige stuk over het verbeteren van de catalogus als discovery tool vind ik de post Lifting out the catalog discovery experience van OCLC's Lorcan Dempsey op zijn weblog. Meer algemeen staat het probleem van de (relatief) dalende populariteit van de catalogus en oplossingen daarvoor centraal in het bekende Calhoun rapport en in het DLIB artikel van Markey "The Online Library Catalog: Paradise Lost and Paradise Regained"
In dit verhaal staan zoveel mogelijk manieren van verrijking van de catalogus en verbetering van de zoekfunctie op een rijtje. Het is de bedoeling dat dit verder aangevuld wordt met mogelijkheden die verder bij de brainstormsessie aangedragen worden, en met voor- en nadelen, kosten, opbrengst en een indicatie voor de wenselijkheid en haalbaarheid van deze mogelijke oplossingen. En daarnaast staat het iedereen vrij om hier tekst toe te voegen of commentaar te leveren!
1. mogelijkheden tijdens de zoekactie
a) extra indexeerbare informatie
Om beter te kunnen zoeken op trefwoorden kan extra indexeerbare informatie toegevoegd worden. Bij voldoende tekst is automatische indexering ook mogelijk en als er meer geïndexeerde tekst is kan er wellicht ook aan relevantie-ordening worden gedaan.
Dit kan met behulp van Syndetics of Blackwell (MARC enrichment). Deze kunnen worden meegeïndexeerd in de catalogus en leveren daardoor een verbetering aan de vindbaarheid, en met name die van hoofdstukken in edited volumes. Dit werkt naar alle waarschijnlijkheid in Aleph, voor Syndetics is Ex Libris zelfs reseller.Zie Syndetics Marc Enrichment en Blackwell Marc Enrichment.
Volgens deze sites levert Syndetics:
• cover images (foto’s van de buitenkant),
• samenvattingen (afkomstig van boekflappen, de uitgever of onafhankelijk via Book News),
• author notes,
• eerste hoofdstukken (afkomstig van Dial-A-Book) uittreksels (incl gedichten, essays, prefaces),
• inhoudsopgaves,
• book reviews
en levert Blackwell:
• inhoudsopgaves
• samenvattingen van boekflappen
• author affiliations
Toch zijn ze waarschijnlijk inhoudelijk gelijk, want bij beide zit het bedrijf Bowker erachter.
Nadelen zijn dat het geld kost en werk vereist om het te implementeren. Mn technische problemen bij het koppelen van de gekochte gegevens aan de boeken vereisen nog wat aandacht bv koppeling aan ISBN (hardcover/paperback) of nieuwe edities (student edition vs algemene editie). Een ander nadeel is dat vanzelfsprekend niet alle boeken in de lijst van Syndetics staan. Aan de andere kant wordt in de e-mail van Syndetics van Darren Roberts ook melding gemaakt van enrichment options including German language material. Het gaat dus steeds verder. Désirée ten Dam vraagt prijsopgave aan Syndetics voor de levering van ruwe data tegelijk met de jaarlijkse renewal (maart 2007).
In de catalogus van Delft http://aleph.library.tudelft.nl/ zijn ook toegevoegd: table of contents, abstract and additional keywords index. Huib Verhoeff, in de rol van informatiespecialist, arrangeert een werkbezoek aan Delft samen met de projectleider. Omdat Delft ook Aleph heeft, kunnen wij mogelijk een hoop leren.
In de VS zijn 5 jaar geleden bij belangrijke bibliotheken implementaties begonnen. De bibliotheek van North Carolina State heeft dit gedaan in haar ook op andere punten voorbeeldige catalogus: een voorbeeld van een zoekactie waar de bovenste titel uit het het resultaat is gevonden via de inhoudsopgave.
b) suggesties
Termsuggesties Bij termsuggesties krijgt de gebruiker tijdens het intypen van een woord in de zoekfunctie, de mogelijkheid om te kiezen uit een lijst met woorden met dezelfde beginletter(s). Zie bijvoorbeeld de suggesties in de Google toolbar, Google suggest of Livetrix Groningen . Bij Google suggest wordt zelfs bij elke keuzemogelijkheid aangegeven hoeveel resultaten dat woord oplevert.
spellingsuggestiesNa een zoekactie kan een spellingsuggestie gegeven woorden, bijvoorbeeld als de zoekactie geen of heel weinig resultaten heeft opgeleverd. (did you mean.... ) .
inhoudelijke suggesties
Na een zoekactie krijgt de gebruiker een "more like this"-keuze en/of "anderen die dit leenden, leenden ook:"; zie het artikel Whitney & Schiff over het recommending system ontwikkeld voor de Universiteit van Califonornië.
verwijzingen/suggesties bij 0 resultaten
Ipv "wijzig de zoekopdracht" zouden we de gebruiker kunnen helpen met het aanbieden van de UBUlink of een directe verwijzing naar Picarta of de Worldcat, naast de bij 4 genoemde spellingsuggesties
c) geografisch zoeken
Gabriel Olson heeft in februari een presentatie over Georeferencing gegeven. Olson is een student die met Google Maps een relatief simpele geografische zoekingang voor antropologie-proefschriften van Berkely heeft gebouwd. Daarbij zijn via een geografische kaart de bijbehorende proefschriften per gebied op te vragen. Google doet sinds kort iets vergelijkbaars, maar dan niet als middel om boeken te vinden, maar om locaties die een rol spelen binnen boeken uit te beelden: georeferencing Google Books (Places mentioned in this book)
De implementatie hiervan is technisch en mogelijk wetenschappelijk een uitdaging. Alleen het automatisch genereren/matchen van toponymen lijkt haalbaar. Bovendien is het ook niet voor alle vakgebieden relevant, maar voor sommige kan het een uitkomst zijn.
2. verrijking van resultaten
a) rangschikken van resultaten
Na een zoekactie die veel resultaten oplevert, is het praktisch om de resultaten naar eigen wens te kunnen rangschikken. Op dit moment wordt standaard geselecteerd op jaar (de nieuwste boven) en daarna op auteur. Verder is het mogelijk om op auteur, titel of type te sorteren, met steeds daarna op jaar. De vraag is even welke andere rangschikkingen mogelijk en zinnig zijn (bv hoe vaak iets al eerder gevonden in, user rankings).
b) extra informatie bij resultaten
Op dit moment kan na een zoekactie extra informatie opgezocht worden over inhoudsopgave en samenvatting. Dit is ook afkomstig van Syndetics. Andere informatie is bijvoorbeeld een analyse van de tekst, een vertaling van (meta-)data of de mogelijkheid om persoonsgegevens bij een naam te vinden.
c) user enrichment
User enrichment =content die door gebruikers wordt toegevoegd. Daar zijn vele mogelijkheden voor: tags, reviews, commentaar, ranking e.d. Zie als voorbeeld de site van Amazon. In de VS zijn ook bibliotheken die experimenteren met user enrichtment. De university of Huddersfield heeft een user rating bij catalogusrecords .
d) permalinks
Permalinks verwijzen naar een catalogusrecord en kunnen gebruikt worden voor het delen van een geslaagde zoekactie. Dat is handig voor studenten en staf die willen verwijzen naar een catalogusrecord. Een voorbeeld is te vinden bij bij de catalogus van de University of Huddersfield, zie de catalogusrecord onderaan
e) terugkoppeling op zoekactie
Bij het resultaat van een zoekactie kunnen parameters aangeboden worden die de zoekactie verfijnen, bijvoorbeeld in trefwoorden, type, auteur, jaar, …
Zie als voorbeeld de eerder genoemde bibliotheek van NCSU (Narrow results by). Je ziet daar onder andere een parametrisch zoekresultaat dat helpt snel in te zoomen (vergelijk wat de Worldcat doet en wat mogelijk is in Autonomy). Wellicht kan de laatste versie van Aleph ook zoiets?
f) Images
Bij de zoekresultaten kan de mogelijkheid geboden worden om images op te vragen van personen (auteurs) of objecten (bv book covers of pagina’s), waarna je kunt inzoomen op deze images of waarbij de gezochte tekst een highlight krijgt in de image.
g) doorverwijzen
Bij de zoekresultaten kunnen links toegevoegd worden waarmee doorverwezen kan worden naar andere sites, bv
• Bestel dit boek bij (een online bookshop)
• Woordenboek (wat betekent...., of een vertaling)
• Een locatie omzetten in coordinaten
• Services om dichtbij gelegen postcodes te vinden
h) overig
Uit de presentatie van Theo van Veen:
• Toevoegen van semantische tags
• Toevoegen recensies aan objecten
Dit project wordt gestart met een brainstorm om zoveel mogelijk vormen van verrijking op tafel te krijgen. Daarna volgt een verkenning van die mogelijkheden en wat de haalbaarheid, consequenties en wenselijkheid van elke optie is. Op basis daarvan kunnen keuzes gemaakt worden over in welke vorm van verrijking wel/niet en snel/later geinvesteerd gaat worden.
Jeroen heeft een lijst met artikelen en rapporten over catalogusverrijking
Comments (0)
You don't have permission to comment on this page.