Arkiv for januar, 2010

Skjermskraping i Access

torsdag, januar 21st, 2010

Jeg får ofte spørsmål om hvilke dataprogrammer som kan brukes til å massenedlaste strukturerte data fra nettet til journalistisk bearbeiding. Teknikken kalles ofte for skjermskraping eller web scraping. 

De alternativene som finnes er ofte kompliserte å bruke. Noen av dem er i tillegg kostbare i innkjøp. Du kunne lenge laste ned RoboMaker fra OpenKapow. Dette programmet var lenge et alternativ. Men en funksjonell versjon av programmet er ikke lenger tilgjengelig. 

Access og makroer

Mange har imidlertid Microsoft Access installert på sin maskin. Dette er i utgangspunktet et program for å lage personlige databaser. 

Makro-knappen finner du under "Opprett"-fanen i siste versjon av Access

Makro-knappen finner du under "Opprett"-fanen i siste versjon av Access. Velg "Modul".

Men Microsoft har forsynt sine Office-applikasjoner med et kraftig programmeringsverktøy som vi kan utnytte. 

Dersom du oppretter et nytt databaseprosjekt, får du muligheten til å opprette tabeller og spørringer. Men i tillegg har du makroer. Under opprett-fanen kan du klikke på pilen nede på ”Makro“-knappen. 

Velg “Modul“. Du kommer da inn i et komplett utviklingsmiljø der du kan bruke programmeringsspråket Visual Basic for Applications (VBA) til å styre nær sagt hva du vil på datamaskinen. 

For å laste ned informasjon fra nettet, trenger du en nettleser, for eksempel Inernet Explorer (IE). IE kan “fjernstyres” fra Access, og koden bak nettsidene du navigerer til kan hentes. Deretter kan du hente ut strukturert informasjon fra nettsiden. 

Jeg har skrevet litt mer konkret om temaet i forbindelse med et innføring jeg hadde for en håndfull spesielt interesserte kolleger på IJ i begynnelsen av denne uken. Hvis du også er spesielt interessert, finner du mer om temaet her.

Ny seier i miljøklagenemnda

mandag, januar 11th, 2010

Siste: I dag (28. januar) kom filen med basestasjonene fra NetCom – innenfor fristen og på et format som gjør det greit å oppdatere kartet på nettet.

I dag kom vedtaket fra miljøklagenemnda, der Netcom pålegges å utlevere en samlet oversikt over sine GSM-basestasjoner til Brennpunkt-redaksjonen. Tidligere er Telenor pålagt å gjøre det samme.

Informasjonen om hvor GSM-senderne står faller inn under bestemmelsene i miljøinformasjonsloven, og skal altså være tilgjengelig for allmennheten.

Les vedtaket her: DOCS-#1384684-v1-NetCom_-_endelig_vedtak

Ifølge klagenemnda er informasjonen om mobilbasestasjonenes plassering å regne som miljøinformasjon som ikke kan holdes tilbake. Dermed har enhver rett til å få utlevert disse opplysningene fra telenoperatørene:

Flertallet kom til at informasjon om mobilmastenes plassering er opplysninger om forhold som kan medføre en ikke ubetydelig påvirkning på miljøet, jf mil. § 9. Sentralt i flertallets vurdering stod at, selv om Statens strålevern ikke per i dag har dokumentasjon på at det foreligger helserisiko ved stråling, medfører den usikkerheten som foreligger og publikums interesse og uro i tilknytning til strålingen fra mastene, at vilkåret om ”ikke ubetydelig påvirkning” jf mil. § 9 må anses oppfylt.

Jeg synes dessuten at det er interessant at flertallet mener den fysiske utplasseringen av mobilmastene alene kan anses som relevant i forhold til miljøinformasjonsloven. Uavhengig av de vurderingene man måtte gjøre i forhold til strålingen: 

(…) For øvrig peker flertallet på at selve den fysiske utplasseringen av mobilmaster rundt om i landet uansett i mange tilfelle trolig ville måtte anses som et forhold som kan ha en ikke ubetydelig påvirkning på miljøet på grunn av de inngrep som dette forårsaker.

Jeg ba om oversikten for å kunne utvide kartet over GSM-senderne ytterligere. Foreløpig inkluderer det kun Telenor sine sendere.

Kartet har vært godt besøkt siden NRK publiserte det på nettet, og interessen for temaet er åpenbart stor.