Kuidas WordPressi sisu Google’i otsingust välja jätta

Kuidas WordPressi sisu ja failid Google'i otsingust välja jätta

Mõnikord peate konkreetse WordPressi sisu või failid Google’i otsingutulemustes indekseerimise välistama. Indeks ehk indekseerimine enne Google’i ja muu otsingumootori ilmumist oli sõna, mida enamasti seostati raamatutega. Tavaliselt asub see enamiku raamatute tagaosas ja seetõttu määratleb Cambridge’i sõnaraamat seda selles kontekstis järgmiselt:


Indeks: tähestikuline loend, näiteks raamatu tagaküljele trükitud loetelu, mis näitab, millisel lehel subjekt, nimi jne asub.

Kiirelt edasi 1995. aastal, Interneti-buumi ajal, on meil sellised teenused nagu Yahoo otsingumootor ja saabub 1997. aasta. Google’i otsing on dramaatiliselt muutnud seda, kuidas me Internetist teavet otsime ja sellele juurde pääseme.

2018. aasta jaanuaris tehtud uuringu kohaselt on Internetis 1 805 260 010 (üle 1,8 miljardi) veebisaidi ja paljud neist veebisaitidest ei saa üldse külastajaid.

Mis on Google’i indekseerimine?

Erinevaid indekseerimisvorminguga otsingumootoreid on erinevaid, kuid populaarsete otsingumootorite hulka kuuluvad Google, Bing ja privaatsust arvestavatele isikutele duckduckgo.

Google’i indekseerimine viitab üldiselt uute veebilehtede, sealhulgas digitaalse sisu (nt dokumendid, videod ja pildid) lisamisele ja nende andmebaasi salvestamisele. Teisisõnu: selleks, et teie saidi sisu Google’i otsingutulemustes ilmuks, tuleb see kõigepealt Google’i registrisse salvestada.

Mis on Google'i indekseerimine?

Google on võimeline indekseerima kõiki neid digitaalseid lehti ja sisu oma ämblike, indekseerijate või robotite abil, mis indekseerivad korduvalt erinevaid veebisaite Internetis. Need robotid ja indekseerijad järgivad veebisaidi omanike juhiseid selle kohta, mida indekseerida ja mida tuleks indekseerimise ajal eirata.

Miks tuleb veebisaite indekseerida?

Sellel digitaalajastu ajastul on peaaegu võimatu liikuda miljardites veebisaitides, mis leiavad kindla teema ja sisu. See on palju lihtsam, kui on olemas tööriist, mis näitab meile, millised saidid on usaldusväärsed, milline sisu on meile kasulik ja asjakohane. Sellepärast on Google olemas ja reastab veebisaidid nende otsingutulemustes.

Indekseerimine muutub asendamatuks osaks otsingumootorite ja eriti Google’i toimimisest. See aitab tuvastada sõnu ja väljendeid, mis kirjeldavad lehte kõige paremini, ning aitab üldiselt kaasa lehe ja veebisaidi paremusjärjestusele. Teie veebisaidi, sealhulgas veebilehtede ja digitaalsete failide, näiteks videote, piltide ja dokumentide, ilmumiseks Google’i esimesel lehel tuleb kõigepealt indekseerida.

Indekseerimine on eeltingimus veebisaitide jaoks üldiselt paremal kohal otsingumootorites ja eriti Google’is. Märksõnu kasutades saab saite paremini üles näha ja avastada pärast otsingumootorite indekseerimist ja järjestamist. See avab uksed rohkematele külastajatele, tellijatele ja potentsiaalsetele klientidele teie veebisaidile ja ettevõttele.

Parim koht surnukeha peitmiseks on Google’i teine ​​leht.

Kui palju on indekseeritud lehti, ei muuda see teie saite automaatselt kõrgemaks, kui ka nende lehtede sisu on kvaliteetne, saate SEO-le tõuke anda.

Miks ja kuidas blokeerida otsimootorit sisu indekseerimisel

Indekseerimine sobib veebisaitide ja ettevõtete omanikele, kuid leidub lehti, mida te ei soovi otsingutulemustes kuvada. võite riskida tundlike failide ja sisu paljastamisega ka Internetis. Ilma paroolide või autentimiseta on privaatsisu sisuga kokkupuute ja loata juurdepääsu oht, kui robotitele antakse tasuta veebisaidi kaustade ja failide üle.

2000. aastate alguses häkkerid kasutas Google’i otsingut krediitkaarditeabe kuvamiseks lihtsate otsingupäringutega veebisaitidelt. Seda turvavea kasutasid paljud häkkerid e-kaubanduse veebisaitidelt kaarditeabe varastamiseks.

Veel üks hiljutine turbe puudus juhtus eelmisel aastal saidil box.com, populaarne pilvesalvestussüsteem. Turvaaugu paljastas Swisscomi ohu luurejuht Markus Neis. Ta teatas, et otsimootorite, sealhulgas Google’i ja Bingi lihtsad ärakasutamised võivad paljastada paljude äriklientide ja üksikute klientide konfidentsiaalseid faile ja teavet.

Sellised juhtumid leiavad aset veebis ja võivad ettevõtete omanikele põhjustada müügi ja tulude vähenemist. Ettevõtete, e-kaubanduse ja liikmeskonnaga seotud veebisaitide jaoks on kriitiliselt oluline esmalt blokeerida tundliku sisu ja privaatsete failide otsingu indekseerimine ja seejärel tõenäoliselt panna need korraliku kasutaja autentimissüsteemi taha.

Vaatame, kuidas saate juhtida sisu ja faile, mida Google ja teised otsingumootorid saavad indekseerida ja indekseerida.

1. Robots.txt kasutamine piltide jaoks

Robots.txt on teie saidi juuresolekul asuv fail, mis pakub Google’ile, Bingile ja teistele otsingumootorite robotitele juhiseid selle kohta, mida indekseerida ja mida mitte. Kui robots.txt-i kasutatakse tavaliselt liikluse ja veebi (mobiili või lauaarvuti) indekseerimise indekseerimiseks, saab seda kasutada ka piltide Google’i otsingutulemustes ilmumise vältimiseks..

Tavaliste WordPressi veebisaitide fail robots.txt näeks välja selline:

Kasutaja agent: *
Keela: / wp-admin /
Keela: / wp-sisaldab /

Tavaline fail robots.txt algab kasutajaagendi juhiste ja tärnide sümboliga. Tärn on juhend kõigile veebisaidile saabuvatele robotitele järgida kõiki selle all pakutavaid juhiseid.

Robot.txt abil hoidke robotid konkreetsetest digitaalsetest failidest eemal

Robots.txt-i saab kasutada ka selleks, et peatada otsingumootorites digifailide, näiteks PDF-ide, JPEG või MP4, indekseerimine. PDF- ja JPEG-faili otsimise indekseerimise blokeerimiseks tuleks see lisada faili robots.txt:

PDF-failid

Kasutaja agent: *
Keela: / pdfs / # blokeerib kataloog / pdfs /.
Keela: * .pdf $ # Blokeeri kõigi failide pdf-failid. Ehkki mittestandardne, töötab see suuremate otsingumootorite jaoks.

Pildid

Kasutajaagent: Googlebot-Image
Keela: /images/cats.jpg #Blokeeri kassid.jpg pilt konkreetselt Googleboti jaoks.

Kui soovite blokeerida kõigi .GIF-piltide indekseerimise ja kuvamise google’i pildiotsingus, lubades samal ajal kasutada muid pildivorminguid, näiteks JPEG ja PNG, peaksite järgima järgmisi reegleid:

Kasutajaagent: Googlebot-Image
Keela: /*.gif$

Tähtis: Ülaltoodud katkendid välistavad teie sisu indekseerimise kolmandate osapoolte saitide, näiteks Google’i poolt. Neile pääseb ligi, kui keegi teab, kust otsida. Failide privaatseks muutmiseks, et keegi neile juurde ei pääseks, peate kasutama mõnda muud meetodit, näiteks neid sisupiirangu pluginaid.

Googlebot-Image’i saab kasutada piltide ja konkreetse pildilaiendi blokeerimiseks Google’i pildiotsingus. Juhul, kui soovite need välistada kõigist Google’i otsingutest, nt veebiotsing ja pildid, on soovitatav selle asemel kasutada Googleboti kasutajaagenti.

Muud veebisaidi erinevate elementide Google’i kasutajaagendid hõlmavad Googlebot-Video videotele kandideerimist veebis Google’i video jaotises. Samamoodi blokeerib Googleboti kasutajaagendi kasutamine kõigi videote kuvamist google’i videotes, veebiotsingus või mobiilse veebiotsingus.

Robotid txt No-Index

Pidage meeles, et robots.txt kasutamine ei ole tundlike või konfidentsiaalsete failide ja sisu blokeerimiseks sobiv meetod järgmiste piirangute tõttu:

  • Robots.txt saab juhendada ainult hea käitumisega indekseerijaid; teised mittevastavad otsingumootorid ja robotid võivad selle juhiseid lihtsalt eirata.
  • Robots.txt ei takista teie serveril nende lehtede ja failide saatmist volitamata kasutajatele nõudmise korral.
  • Otsingumootorid leiavad endiselt teie blokeeritud lehe ja sisu üles ja indekseerivad, juhul kui need on lingitud muudelt veebisaitidelt ja allikatest.
  • Robots.txt on juurdepääsetav kõigile, kes saavad seejärel lugeda kõiki teie esitatud juhiseid ja pääseda otse sellele sisule ja failidele juurde

Otsingu indekseerimise blokeerimiseks ja teie isikliku teabe tõhusamaks kaitsmiseks kasutage selle asemel järgmisi meetodeid.

2. Indekseerimiseta meta-siltide kasutamine lehtede jaoks

Indekseerimiseta meta-sildi kasutamine on õige ja tõhusam meetod tundliku sisu otsingu indekseerimise blokeerimiseks oma veebisaidil. Erinevalt robots.txt-ist paigutatakse indekseerimiseta meta-silt väga lihtsa HTML-sildiga veebilehe jaotis:



...

Lehte, mille päises on see juhis, ei kuvata Google’i otsingutulemustes. Muud direktiivid nagu nofollow ja not translate, saab kasutada ka käsku veebi indekseerijatel mitte indekseerida linke ja pakub vastavalt selle lehe tõlkeid.

Mitmeid indekseerijaid saate juhendada, kasutades lehe mitut metakoodeista järgmiselt:



...


Selle koodi oma veebisaidile lisamiseks on kaks võimalust. Esimene võimalus on luua WordPressi alamteema, seejärel saate oma function.php-is kasutada WordPressi toimingukonksu wp_head, et sisestada umbesdex või mõni muu metamärgend. Allpool on näide sellest, kuidas soovite oma sisselogimislehte indekseerida.

add_action ('wp_head', funktsioon () {
if (is_page ('sisselogimine')) {
kaja '';
}
});

Teine võimalus on kasutada SEO nähtavuse kontrollimiseks oma SEO pistikprogrammi. Näiteks Yoast SEO abil saate minna lehe täpsemate sätete jaotisesse ja valida lihtsalt valikute jaoks Ei, et lubada otsingumootoril lehte näidata:

Pärmi SEO otsingutulemite seadistamine

3. X-Robots-Tag HTTP-päise kasutamine teiste failide jaoks

X-Robots-silt annab teile suurema paindlikkuse, et blokeerida teie sisu ja failide otsingu indekseerimine. Eelkõige võib seda indekseerimiseta meta-märgendiga võrreldes kasutada HTTP-päise vastusena mis tahes antud URL-i jaoks. Näiteks saate X-Robots-Tag-i kasutada pildi-, video- ja dokumendifailide jaoks, kus pole võimalik kasutada robotite metasilte.

Saad lugeda Google’i täielik robotite meta-sildi juhend, kuid nii saate juhiseid indekseerijatele mitte jälgida ja indekseerida JPEG-pilti, kasutades selle HTTP-vastuses X-Robotsi silti:

HTTP / 1.1 200 OK
Sisu tüüp: image / jpeg
Kuupäev: laupäev, 27. november 2018 01:02:09 GMT
(…)
X-robotid-silt: umbesdex, nofollow
(…)

Kõik juhised, mida saaks kasutada koos robotite metasildiga, kehtivad ka X-Robots-Tagidele. Samamoodi saate juhendada ka mitut otsingumootori robotit:

HTTP / 1.1 200 OK
Kuupäev: teisipäeval, 21. septembril 2018 21:09:19 GMT
(…)
X-robotid-silt: googlebot: nofollow
X-robotid-silt: bingbot: umbesdex
X-robotid-silt: muu robot: noindex, nofollow
(…)

Oluline on arvestada, et otsingumootorite robotid avastavad indekseerimise ajal robotite metamärgendid ja X-Robots-Tag HTTP-päised. Nii et kui soovite, et need robotid järgiksid teie juhiseid mitte järgida ega indekseerida mingit konfidentsiaalset sisu ja dokumente, ei tohi te takistada nende lehtede ja failide URL-ide indekseerimist.

Kui neil pole robots.txt-faili abil indekseerimine blokeeritud, ei loeta teie indekseerimise juhiseid ja neid ignoreeritakse. Seetõttu indekseerivad Google ja muud otsingumootorid juhul, kui muud veebisaidid lingivad teie sisu ja dokumentidega.

4. .htaccess-reeglite kasutamine Apache-serverite jaoks

Võite ka oma .htaccess-faili lisada päise X-Robots-Tag HTTP-päise, et takistada indekseerijatel Apache serveris hostitud veebisaidi lehti ja digitaalset sisu indekseerimast. Erinevalt indeksita meta-siltidest saab .htaccess-reegleid rakendada kogu veebisaidil või konkreetses kaustas. Regulaarsete avaldiste tugi pakub veelgi suuremat paindlikkust, et saaksite korraga sihtida mitut failitüüpi.

Googleboti, Bingi ja Baidu veebisaidi või spetsiaalse kataloogi indekseerimise blokeerimiseks kasutage järgmisi reegleid:

RewriteEngine sisse lülitatud
RewriteCond% {HTTP_USER_AGENT} (googlebot | bingbot | Baiduspider) [NC]
RewriteRule. * - [R = 403, L]

Kõigi .txt-, .jpg-, .jpeg- ja .pdf-failide otsingu indekseerimise blokeerimiseks kogu veebisaidil lisage järgmine fragment:


Päisekomplekt X-Robotid-silt "noindex, nofollow"

5. Lehe autentimise kasutamine koos kasutajanime ja parooliga

Ülaltoodud meetodid takistavad teie privaatse sisu ja dokumentide kuvamist Google’i otsingutulemustes. Kõik kasutajad, kellel on link, saavad teie sisu juurde pääseda ja teie failidele otse juurde pääseda. Turvalisuse tagamiseks on tungivalt soovitatav seadistada õige autentimine kasutajanime ja parooliga ning rollipääsulubadega.

Lehe autentimise kasutamine

Näiteks autentimisvärava taha tuleks lükata lehed, mis sisaldavad töötajate isiklikke profiile ja tundlikke dokumente, millele anonüümsed kasutajad ei tohi juurde pääseda. Nii et isegi kui kasutajatel õnnestub mingil viisil lehti leida, küsitakse enne sisu kontrollimist volitusi.

WordPressi paroolikaitse

WordPressi abil saate selle postituse nähtavuseks lihtsalt seada parooliga kaitstud. Nii saate valida selle lehe sisu vaatamiseks vajaliku parooli. Seda on postituse / lehe kohta üsna lihtne teha. Saidi täielikuma privaatsuse tagamiseks proovige oma veebisaidile lisada üks neist WordPressi liikmelisuse pistikprogrammidest.

Pidage meeles, et otsimootorite ja külastajate parooliga kaitstud või varjatud lehed ei kaitse tingimata selle sisule lisatud dokumente, videoid ja pilte. Teie WordPressi failide üleslaadimise tõeliseks kaitsmiseks on äärmiselt soovitatav kasutada lisatasu teenust, näiteks Prevent Direct Access Gold.

Järeldus

Google’i esimesel lehel võistlemisel ei pruugi ettevõtete omanikud arvestada sellega, mida otsingumootorid näevad. Kas blokeerite robotid kindla faili eest, peidate kohandatud sisselogimislehte või parooliga kaitste privaatsete kasutajate katalooge … leidub palju lehti, mille puhul tuleb otsimootorite puhul mitte indekseerida.

Kas teil on küsimusi sisu väljajätmise kohta otsingutulemustes? Või takistada teatud failide indekseerimise bingimist? Jäta kommentaar allpool!

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map