Forum: PC Hard- und Software Wie kann Google gesperrte Webseiten lesen??


von Gouda (Gast)


Lesenswert?

Wenn ich mit Google nach diesem Text "Ostermontag rollt der erste Zug 
über die Bahnumfahrung" suche, dann findet es als erstes zwei Links, die 
diesen Text enthalten. In seiner Vorschau zeigt Google diesen Text an, 
wie er offensichtlich auf den beiden Webseiten steht.

Wenn ich aber diese beiden Webseiten aus den Google Suchergebnissen

https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwifsdm3lJ33AhXC0aQKHSkaDeMQFnoECAwQAQ&url=https%3A%2F%2Fwww.nwzonline.de%2Fplus-friesland%2Fsande-wilhelmshaven-bahnausbau-mehr-als-750-pfaehle-halten-galerie-stabil_a_51%2C6%2C4236364176.html&usg=AOvVaw1O3Vli1f3kBkQYwCK219gE

https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwifsdm3lJ33AhXC0aQKHSkaDeMQFnoECAwQAQ&url=https%3A%2F%2Fwww.nwzonline.de%2Fplus-friesland%2Fsande-wilhelmshaven-bahnausbau-mehr-als-750-pfaehle-halten-galerie-stabil_a_51%2C6%2C4236364176.html&usg=AOvVaw1O3Vli1f3kBkQYwCK219gE

aufrufe, zeigen die Seiten nur eine Überschrift. Der restliche Text ist 
gesperrt und nur durch ein Abonnement zu lesen. Der von Google zitierte 
Text steht nicht in der Überschrift und wird mir nicht angezeigt. Er 
muss also demnach im gesperrten Teil vorkommen. Wie kann Google den 
trotzdem sichtbar machen?

von A-Freak (Gast)


Lesenswert?

Der Server von der Zeitung bekommt vom Browser die 
Benutzeragentenkennung, IP-Addresse und kann damit vergleichen obs ein 
Google-Bot ist oder ein normaler Benutzer.

Der Google-Bot bekommt den ganzen Text um Neukunden "anzufüttern" daß 
die in den Suchergebnissen sehen was es nach Abo-Zahlung zu lesen gibt.

von Mark S. (voltwide)


Lesenswert?

Gut zu wissen. Spricht massiv gegen die Nutzung dieser Suchmaschine.

von Dieter (Gast)


Lesenswert?

Gouda schrieb:
> Der von Google zitierte
> Text steht nicht in der Überschrift und wird mir nicht angezeigt.

Habe auch schon erlebt, dass im Text (wenn man jemanden kennt, der ein 
Abo hat) was ganz anderes stand, d.h. das Gegenteil.

von oszi40 (Gast)


Lesenswert?

Evtl. wird erst die ganze Seite geliefert und DANN erst die Daten usw. 
verglichen? In dieser Zeit hat G* schon alles maschinell erfasst. Bei 
einem langsamen PC sieht man erst die ganze Seite und etwas später 
kommen die hinderlichen Fenster durch diverse Funktionen.

"smart_button_validation_error_expected_intent_subscription Object { 
intent: "capture", timestamp: "1650272876194", referer: 
"www.paypal.com", sdkCorrelationID: "f1005126ac5ba", sessionID: 
"uid_12e84b94da_mdk6mdc6xyz", clientID: ..."

von Michael M. (do7tla)


Lesenswert?

Im Firefox mal das Plugin User Agent Switcher installieren.
In diesen dann die Kennung eines Bot einstellen und dann nochmal 
versuchen die Seite aufzurufen.
Falls das nicht funktioniert, dann mal den Browsercache leeren und die 
Cookies löschen.

: Bearbeitet durch User
von c-hater (Gast)


Lesenswert?

Mark S. schrieb:

> Gut zu wissen. Spricht massiv gegen die Nutzung dieser Suchmaschine.

Das ist doch nicht die Schuld von Google. Das ist die Schuld der 
Seitenbetreiber. Die (und nicht google) sorgen dafür, dass der 
google-Bot den Inhalt zu sehen bekommt, der für den Normal-Aufrufer 
hinter einer Paywall versteckt ist.

Übrigens sind viele Seiten ziemlich primitiv konstruiert. Die Chancen 
stehen recht gut, dass man mit abgeschaltetetem JavaScript die 
gewünschten Inhalte zu sehen bekommt. Allerdings ist es mindestens 
genauso wahrscheinlich, dass man einfach nur eine leere oder fast leere 
Seite zu sehen bekommt.

von Zeno (Gast)


Lesenswert?

Mark S. schrieb:
> Gut zu wissen. Spricht massiv gegen die Nutzung dieser Suchmaschine.

Nö eher gegen den der die Webseite bereit stellt. Dem komm es ganz 
offensichtlich nur auf den schnöden Mammon an und dazu scheint jedes 
Mittel recht zu sein.

von Bernd B. (bbrand)


Lesenswert?

Schaut euch doch einfach mal den Seitenquelltext an, anstatt wild zu 
spekulieren.
Darin findet sich folgender Eintrag:

<meta name="description" content="Die Arbeiten an der Bahnumfahrung 
Sande stehen kurz vor dem Abschluss: Am Ostermontag, 18. April, rollt 
der erste Zug &amp;uuml;ber die Bahnumfahrung          ..."/>

Also keine Sonderzugriffsrechte für Google, sondern einfach eine von der 
Web-Software eingebaute Kurzbeschreibung.

Gruß,
Bernd

von Dieter (Gast)


Lesenswert?

Bernd B. schrieb:
> den Seitenquelltext

Bääh, das ist so viel zu einfach. Das bremst den Spass viel zu früh aus. 
Lösche mal Deinen Beitrag und poste den in ein paar Tagen neu. ;o))

von Thilo R. (harfner)


Lesenswert?

Oh manno, jetzt hast Du allen Verschwörungstheorien den Boden entzogen! 
Wie kannst Du es wagen, mit Fakten zu kommen?

von Gouda (Gast)


Lesenswert?

A-Freak schrieb:
> Der Google-Bot bekommt den ganzen Text um Neukunden "anzufüttern" daß
> die in den Suchergebnissen sehen was es nach Abo-Zahlung zu lesen gibt.

Hmh, wenn der Text verborgen werden soll, dann ist es eine schlechte 
Idee, ihn Google zu geben. Denn das veröffentlicht ihn in seinem Cache, 
wo ihn jeder lesen kann. Beim Schreiben des Ursprungspostings wusste ich 
das noch nicht und bin jetzt zufällig drüber gestolpert.

von Mark S. (voltwide)


Lesenswert?

c-hater schrieb:
> Das ist doch nicht die Schuld von Google. Das ist die Schuld der
> Seitenbetreiber. Die (und nicht google) sorgen dafür, dass der
> google-Bot den Inhalt zu sehen bekommt, der für den Normal-Aufrufer
> hinter einer Paywall versteckt ist.
ok, verstanden.

von Markus (Gast)


Lesenswert?


von Gouda (Gast)


Lesenswert?

Markus schrieb:
> https://github.com/iamadamdev/bypass-paywalls-chrome

Ich frage mich immer wieder, was solch ein Hinweis auf eine Github-Seite 
sagen will. Bei der dort vorgefundenen Auswahl an Links, die mit "Code, 
Issues, Pull requests, Actions, Projects, Security, Insights, Fork, 
Master, Branch, Test" betitelt sind, weiß man als Normal-Sterblicher mit 
Englischkenntnissen nicht, wohin man jetzt klicken soll.

von Georg (Gast)


Lesenswert?

Mark S. schrieb:
> Spricht massiv gegen die Nutzung dieser Suchmaschine.

Typischer irrationaler Hasspost ohne jede sachliche Grundlage.

Georg

von Christian H. (netzwanze) Benutzerseite


Lesenswert?

Mark S. schrieb:
> Spricht massiv gegen die Nutzung dieser Suchmaschine.

Spricht massiv gegen die Nutzung des Internet.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.