Skrabning af indhold (aka web skrabning, web høst, web data mining osv.) er fremgangsmåden til kopiering af data fra et websted. "Skraberne" (vinduesviskere) indhold er de personer eller software, der kopierer dataene. Webskrabning er ikke en dårlig ting.

Faktisk er alle webbrowsere grundlæggende indholdsskrabere. Der er mange legitime formål med at udføre skrabning af indhold, f.eks. Webindeksering til søgemaskiner.

Se vores artikel om Sådan stopper du Google fra at indeksere din WordPress-blog

Den virkelige bekymring er, om skrabere af indhold på dit websted er skadelige eller ej. Konkurrenter ønsker måske at stjæle dit indhold og offentliggør den som tilhørende dem. Hvis du kan fortælle legitime brugere fra onde fyre, har du en bedre chance for at beskytte dig selv. Denne artikel forklarer det grundlæggende ved skraberning af weben samt nogle metoder til at slippe af med det (eller i det mindste mindske deres betydning).

Men før, hvis du aldrig har installeret WordPress-opdagelse Sådan installeres en WordPress blog i 7 trin et Hvordan at finde, installere og aktivere et WordPress tema på din blog 

Så tilbage til, hvorfor vi er her.

Typer af indholdsskrabere

Der er mange forskellige måder for indholdsskrabere at downloade data på. Det er vigtigt at kende de forskellige metoder og den teknologi, de bruger. Metoderne spænder fra lavteknologi (en person manuelt kopierer og indsætter indholdet) til sofistikerede robotter (automatiseret software, der er i stand til at simulere menneskelig aktivitet i en browser). Her er en oversigt over, hvad du muligvis skal gøre:

  • edderkopper: Webcrawling er en stor del af, hvordan indholdsskrabere fungerer. En edderkop som Googlebot starter med at samle en enkelt webside og gå fra link til link for at downloade websider.
  • Shell scripts: Du kan bruge Linux Shell til at oprette indholdsskrabere med scripts som GNU Wget til at downloade indhold.
  • HTML-skraber: de ligner shell-scripts. Denne type skraber er meget almindelig. Det fungerer ved at få HTML-strukturen på et websted til at finde data.
  • Skærmbilleder: En skærmvisker er et program, der fanger data fra et websted ved at efterligne en menneskelig brugeres opførsel, der bruger en computer til at surfe på Internettet.
  • Menneske kopi: Det er her en person manuelt kopierer indhold fra dit websted. Hvis du nogensinde har skrevet online, har du måske bemærket, at plagiering er udbredt. Når den indledende smiger er forsvundet, passer den virkelighed, at nogen tjener på dit job.

Der er flere måder at gøre det samme på. De ovennævnte kategorier af skrabere er ikke en udtømmende liste. Derudover er der meget overlap mellem kategorierne.

Læs også vores artikel om Hvordan og hvorfor en kvalitativ revision af dit indhold

Sådan beskytter du din blog

Beskyt en blog mod indholdsskrabere

1. Bedøm begrænsning og blokering

Du kan bekæmpe mange bots ved først at opdage problemet. Det er typisk for en automatiseret robot at spam din server med et usædvanligt stort antal anmodninger. Rate throttling, som navnet antyder, begrænser serveranmodninger fra en individuel klient ved at indstille en regel.

Du kan gøre ting som at måle millisekunder mellem anmodninger. Hvis interaktionen med dit websted er for hurtig, ved du, at det er en bot. Derefter blokerer denne IP-adresse. Du kan blokere IP-adresser baseret på et antal kriterier, inklusive deres oprindelsesland.

2. Registrering og forbindelse

Registrering og login er en populær måde at holde indholdet væk fra nysgerrige øjne. Du kan forhindre udviklingen af ​​robotterne. Alt hvad du skal gøre er at gøre adgang til dit indhold betinget af en forbindelse. Grundlæggende om login-sikkerhed gælder her. Husk, at sider, der kræver registrering og login, ikke indekseres af søgemaskiner.

3. Honeypots og falske data

I datalogi er "honeypots" virtuelle stingoperationer. Du afrunder potentielle angribere ved at indstille fælder med en honningpotte for at opdage trafik fra indholdsskrabere. Der er et uendeligt antal måder at gøre dette på.

For eksempel kan du tilføje et usynligt link på din webside. Opret derefter en algoritme, der blokerer IP-adressen til klienten, der klikkede på linket. Mere sofistikerede honningpotter kan være vanskelige at opsætte og vedligeholde. Den gode nyhed er, at der er mange open source Honeypot-projekter derude. Tjek dette fantastiske liste over fantastiske honeypots på github.

4. Brug en CAPTCHA

Captcha betyder " Helt Automatiseret Public Turing test til at fortælle Computere og Mennesker Bortset dybest set en test for at se forskel på mennesker og robotter. Captchas kan være kedelige, men de er også nyttige. Du kan bruge en til at blokere områder, du tror, ​​en bot måske vil målrette mod, f.eks. en e-mail-knap på din Kontaktformular. Der er mange gode Captcha-plugins tilgængelige på WordPress, inklusive " Captcha Fra Jetpack.

Oplev også nogle premium WordPress-plugins  

Du kan bruge andet WordPress plugins for at give et moderne udtryk og for at optimere håndteringen af ​​din blog eller hjemmeside.

Vi tilbyder dig her nogle premium WordPress-plugins, der hjælper dig med det.

1. Stripe til Arforms

ARForms har en ny udvidelse, der accepterer betalinger via Stripe-betalingsgatewayen. Det kaldes “ARForms Stripe”. Sidstnævnte integrerer forminput og betalinger i en enkelt proces.

Stribe til arformer

Du kan fakturere kunder med et dynamisk beløb øjeblikkeligt efter ARForms formindgivelse.

Læs også vores artikel om Sådan bruger Stripe om WooCommerce og Easy Digital Download

Du skal bare oprette en formular med ARForms, konfigurere den med Stripe, og alt er gjort! Du kan indstille betaling med Stripe på kort tid.

Downloade | demo | Web-hosting

2.AX Social Stream

Hvis du vil vis flere sociale mediefeeds på dit websted, derefter plugin WordPress Social Board giver dig mulighed for at gøre dette ved at give dig seks måder at se din kontoaktivitet på. Du vil også drage fordel af support til 17 sociale netværk og flere layouter, der kan tilpasses.

Ax social stream wordpress plugin

Dens funktioner er blandt andet: 6 forskellige feed-displaytilstande, understøttelse af et stort flertal af sociale netværk, fuldt responsivt layout, support til reklamebannere, Flersproget support, en temaleder, detaljeret dokumentation osv ...

Downloade | demo | Web-hosting

3. Interaktive verdenskort

Interaktive verdenskort hjælper dig med at oprette så mange geografiske kort som du vil, kontinenter, lande eller regioner ... og dette med interaktive og farvede markører.

Kort Interactive World

Det er kompatibelt med de nyeste versioner af WordPress og passer perfekt til Visual Composer-plugin.

Opdag vores 8 WordPress plugins til at tilpasse udseendet af dit websted

Takket være interaktive verdenskort kan du vise flere typer regioner, såsom: et kort over hele verden, et kontinent eller et subkontinent, et land og meget mere.

Downloade demo | Web-hosting

Andre anbefalede ressourcer

Vi inviterer dig også til at konsultere nedenstående ressourcer for at komme videre i grebet og kontrollen af ​​dit websted og blog.

Konklusion

Der! Det var alt for denne tutorial, jeg håber, det vil hjælpe dig med at oprette en praktisk huskeliste for effektivt at beskytte din WordPress blogdu er velkommen til del tipet med dine venner på dine sociale netværk.

Du vil dog også kunne konsultere vores ressourcer, hvis du har brug for flere elementer til at udføre dine projekter med oprettelse af internetsider ved at konsultere vores guide om WordPress blog oprettelse.

Men i mellemtiden, fortæl os om din kommentarer og forslag i det dedikerede afsnit.

...