Google & Co erkennen

BSA

Erfahrenes Mitglied
Hi Leute!

Ich habe gerade eine Idee für ein Script gehabt, was wird aber noch nicht verraten. Für dieses Script müsste ich wissen wie ich Google & Co erkennen kann. Das heißt die Searchbots die sich auf die Suche nach Webseiten machen. Ich weiß nicht genau ob das nun der richtige Begriff dafür ist, aber ich hoffe erstmal das ihr trotzalledem wisst was ich meine. Also ich will erkennen welcher Suchmaschienenbot auf meine Seite zugegriffen hat und die IP herausbekommen. Geht sowas? Müsste eigentlich Funktionieren, oder?
Hat jetzt jemand ne Idee wonach ich da suchen kann oder kann mir evt. gleich jemand einen Lösungsansatz geben?

Würde mich sehr freuen.

Gruß BSA
 
Weißt du Zufällig auch wie die sich zur Erkennung geben also was die denn für UserAgent haben (drin steht)?
 
Ich hab einer ganzen Weile im Internet mal eine Liste der UserAgents die von Suchmaschinen genutzt werden gefunden. Aber keine Ahnung wo die war.
Das sind auf jeden Fall nicht wenige.
 
Ich habe gerade evt. eine andere Möglichkeit gefunden. Ich möchte ja eigentlich nur erreichen das Google & Co einem einzigen bestimmten Link nicht folgt.

Würde das funktionieren wenn ich einem <a>-Tag den rel="nofollow" Parameter übergebe? Oder listet Google dann einfach diese Seite worauf der Link führt nicht oder ignoriert er diesen ganz, sodass er ihn nicht weiter verfolgt?
 
Dazu kann ich Dir nichts sagen.
Aber wenn Du willst dass bestimmte Seiten nicht indiziert werden sollen, dann kannst Du mit der robots.txt und mit dem Robots-Meta-Tag arbeiten.
 
Nein, ums Indexieren geht es nicht, es geht nur darum das Google einem Link nicht folgen darf (der zu einem PHP Script führt)! Das ist mein Problem!
 
Mist, habe gerade folgendes gefunden:

Und die Auswirkungen von NoFollow?
Für die mit dem "NoFollow"-Attribut gekennzeichneten Links gelten folgende Regeln:

* Diese Links werden vom Suchmaschinen-Spider zwar verfolgt, der Inhalt der verlinkten Seite wird jedoch nicht in den Index aufgenommen.
* Die verlinkten Seiten erhalten bei der Pagerank-Berechnung keinen zusätzlichen PR PageRank (kurz PR ist das von der Internet-Suchmaschine Google genutzte System für die Bewertung der gelisteten Seiten..
* Suchmaschinen beachten den entsprechenden Alt- und Link-Text nicht.

Da muss ich wohl was anderes finden!
 
die einfachste Variante ist einfach den Link für die Searchbots auszublenden. Ohne Link können die auch nichts verfolgen. das mit der Robots.txt tut nicht, zB "das InternetArchiv" ignoriert diese und hatte deshalb auch schon ein Gerichtsverfahren am Hals (in USA)
 
Zurück