Skjermskraping i Access

Jeg får ofte spørsmål om hvilke dataprogrammer som kan brukes til å massenedlaste strukturerte data fra nettet til journalistisk bearbeiding. Teknikken kalles ofte for skjermskraping eller web scraping. 

De alternativene som finnes er ofte kompliserte å bruke. Noen av dem er i tillegg kostbare i innkjøp. Du kunne lenge laste ned RoboMaker fra OpenKapow. Dette programmet var lenge et alternativ. Men en funksjonell versjon av programmet er ikke lenger tilgjengelig. 

Access og makroer

Mange har imidlertid Microsoft Access installert på sin maskin. Dette er i utgangspunktet et program for å lage personlige databaser. 

Makro-knappen finner du under "Opprett"-fanen i siste versjon av Access

Makro-knappen finner du under "Opprett"-fanen i siste versjon av Access. Velg "Modul".

Men Microsoft har forsynt sine Office-applikasjoner med et kraftig programmeringsverktøy som vi kan utnytte. 

Dersom du oppretter et nytt databaseprosjekt, får du muligheten til å opprette tabeller og spørringer. Men i tillegg har du makroer. Under opprett-fanen kan du klikke på pilen nede på ”Makro“-knappen. 

Velg “Modul“. Du kommer da inn i et komplett utviklingsmiljø der du kan bruke programmeringsspråket Visual Basic for Applications (VBA) til å styre nær sagt hva du vil på datamaskinen. 

For å laste ned informasjon fra nettet, trenger du en nettleser, for eksempel Inernet Explorer (IE). IE kan “fjernstyres” fra Access, og koden bak nettsidene du navigerer til kan hentes. Deretter kan du hente ut strukturert informasjon fra nettsiden. 

Jeg har skrevet litt mer konkret om temaet i forbindelse med et innføring jeg hadde for en håndfull spesielt interesserte kolleger på IJ i begynnelsen av denne uken. Hvis du også er spesielt interessert, finner du mer om temaet her.

Tags: , , , ,

Én kommentar til “Skjermskraping i Access”:

  1. Ojda, du skal bare visst hvor stor nytte jeg hadde hatt av dette for et par måneder siden. Har brukt ukesvis på å dytte store mengder data inn i en Access-database – manuelt. Nå er jobben gjort, men neste gang vet jeg trikset.

    Hjertelig takk for at du deler dette. Svært nyttig!

Kommentér innlegget