Semalt-expert vertelt hoe het schrapen van webgegevens werd gelegaliseerd met een rechterlijke uitspraak

Hoewel het illegaal is om gegevens van websites te schrapen zonder de uitdrukkelijke toestemming van de eigenaren van de site, heeft een rechter onlangs onder bepaalde omstandigheden anders beslist. hiQ Labs heeft onlangs een rechtszaak aangespannen tegen LinkedIn om te voorkomen dat ze gegevens uit LinkedIn-pagina's halen.

Het was voor de meeste mensen een grote schok dat LinkedIn te horen kreeg dat de startup gratis toegang moest krijgen tot zijn webpagina's. hiQ gebruikte zijn algoritmen om te detecteren wanneer een LinkedIn-gebruiker naar een baan zoekt op basis van de wijzigingen die de gebruiker aanbrengt in zijn / haar openbare profiel.

De algoritmen worden uitgevoerd op gegevens die zijn geëxtraheerd van de LinkedIn-webpagina's. Zoals verwacht, vond LinkedIn het niet leuk en werden er tegenmaatregelen genomen om te voorkomen dat hiQ verdere data-extractie zou uitvoeren. Afgezien van de opgezette technische belemmeringen, werden er ook krachtig geformuleerde juridische waarschuwingen gegeven.

De startup had geen andere keus dan het probleem legaal aan te pakken. hiQ moest juridisch verhaal zoeken. Het bedrijf wilde dat LinkedIn de technische belemmeringen wegnam. hiQ wilde ook dat zijn data-extractieproces op LinkedIn werd gelegaliseerd.

Gelukkig voor de startup kreeg het wat het wilde. De uitspraak was in het voordeel van hiQ. LinkedIn kreeg de opdracht om alle tegenmaatregelen die hiQ verhinderden om zijn (LinkedIn) webpagina's te schrappen, te verwijderen en hiQ de vrije hand te geven, aangezien de handeling volledig legaal is. De rechter hing zijn uitspraak af op het feit dat hiQ gegevens wil schrapen die openbaar zijn gemaakt.

De rechter gelastte niet alleen de verdachte om alle preventieve maatregelen tegen hiQ in te trekken, maar beval ook dat de verdachte in de toekomst van dergelijke handelingen zou afzien.

Open webgegevens promoten

Hoewel de uitspraak nog steeds een tijdelijk bevel is, is het hartverwarmend om te horen dat de wet open webgegevens en vrije toegang tot informatie op internet ondersteunt, aangezien deze uitspraak dat bevestigt. Zelfs als de uiteindelijke beslissing de verdachte ten goede komt, is dit feit al bewezen.

De rechter heeft dit beleid gepromoot door vrijwel alle argumenten van LinkedIn af te sluiten. Terwijl LinkedIn probeerde vast te stellen dat de eiser zijn privacy schond, heeft de rechter dit tegengegaan met het feit dat de verdachte ook de gegevens verkoopt.

Toen het argument niet opging, verklaarde de verdachte ook dat de handeling van hiQ een grove schending was van de Computer Fraud and Abuse Act (CFAA) omdat de startup toegang had tot hun servers om gegevens illegaal te verzamelen. Opnieuw werd het argument doorprikt. Het werd afgewezen omdat hiQ alleen inhoud schraapte op de openbare, niet-beveiligde pagina's.

De rechter heeft de zaak vergeleken met iemand die tijdens kantooruren een open winkel binnenloopt. Van zo iemand kan niet worden gezegd dat hij inbreuk maakt. Dus hiQ betrad geen overtredingen. Interessant is dat de rechter verder is gaan uitleggen waarom zijn uitspraak in het algemeen belang is.

Kort gezegd accepteerde de rechtbank dat het in het algemeen belang is om gegevens te laten crawlen, extraheren en analyseren. Het zal dus een schadelijk beleid zijn om de plaatsing van belemmeringen voor de vrije informatiestroom aan te moedigen.

Wat je moet leren van de uitspraak

Hoewel u misschien geen redenen heeft om gegevens rechtstreeks van LinkedIn te extraheren, moet u van de uitspraak leren. Het is beter om veilig te spelen door het robots.txt-bestand van alle websites te lezen en te respecteren. Onthoud dat de uitspraak nog steeds een tijdelijk bevel is. Het zou uiteindelijk in het voordeel van LinkedIn kunnen gaan.

Hoewel de uitspraak mogelijk niet rechtstreeks op u van toepassing is, is het verheugend dat een federale rechtbank het beleid handhaaft om het internet open te houden voor het publiek. Informatie moet dus beschikbaar en toegankelijk zijn voor degenen die kunnen zoeken en er goed gebruik van kunnen maken.

Webgegevens zijn uiterst nuttig voor iedereen, vooral voor media-analisten, ontwikkelaars, gegevenswetenschappers en enkele andere professionals. Als zodanig is de uitspraak een welkome ontwikkeling.

mass gmail