Verbeteren van Way en de WDA

Een paar dagen terug schreef ik op mijn eigen blog een post dat te maken had met OA repositories en digitale theses. Ik illustreerde mijn verhaal aan de hand aan een voorbeeld over een thesis uit Leiden die niet in Google terug te vinden was. Over het algemeen lijken onze theses goed geindexeerd in Google Scholar, maar dat heb ik niet uitputtend gecontroleerd maar niet in Google.

Wat ik voorstelde als oplossing in Leiden zouden we in feite ook in Wageningen kunnen doen. Alle electronische theses opknippen in hoofdstukken en de hoofdstukken als pre-prints in de repository opnemen. Voorwaarde hiervoor is wel dat Way, beter om kan gaan met versies. Dus preprints tonen wanneer we die hebben en het mag, en publishers postprints wanneer iemand op ons eigen netwerk daar toegang toe zou hebben.

Nu stimuleren we auteurs financieel door publicatie in OA tijdschriften te betalen. We zouden moeten bezien of we dat geld niet beter in kunnen inzetten door ons eigen archief beter te vullen door pre-prints uit de theses te knippen en die ook te archiveren. Dat zal in het begin handwerk zijn, maar wanneer een goed begin en basis hebben, kunnen we auteurs er op wijzen hoe we dit voor henzelf kunnen laten doen. Dit in de volle overtuiging dat OA aan het eind van de dag impact verhogend werkt.

Advertenties

Mining van wetenschapplijke text corpora

Tijdens de koffie kwam het onderwerp van het textmining en linguïstisch analyseren van wetenschappelijke teksten even voorbij, naar aanleiding van een lezing die AB tijdens de patentendag in Utrecht afgelopen donderdag bijgewoond had. De Nijmeegse onderzoeker had moeite met het vinden van voldoende grote bestanden om zijn tools op los te laten.

Het deed mij een bel rinkelen naar de verhalen van John Willbanks die ik tijdens de Ticer cursus afgelopen jaar had gehoord. Daar kwam ook naar voren dat copyrights in de meeste gevallen dit soort onderzoek ernstig hinderen.

Vandaag keek ik daarom op van een artikel op OA news over de onmogelijk om PubMedCentral niet ge-datamined kan worden. Zelfs een repository als PubMedCentral is dus geen OA is of staat dit soort activiteiten niet toe. Een ervaren OA advocaat als Dr. Peter Murray Rust ging hier in de fout met zijn veronderstellingen. Wie ben ik dan?

Ik blijf dit onderwerp van copyrights een mijnenveld vinden. Maar ik neem veilig aan dat Elsevier niet toestaat dat we ScienceDirect gaan minen, of harvesten om dat eventueel mogelijk te maken.

Ach verder was het slechts koffietafelpraat.

References
Willbanks, J. (2007). Cyberinfrastructure for Knowledge Sharing CTWatch Quarterly 3(3): 58-66. http://www.ctwatch.org/quarterly/articles/2007/08/cyberinfrastructure-for-knowledge-sharing/