kleiner Crawler

Ich rede nicht von $domain sondern von :
in_google_index("nepda.de");
Das nepda.de kann ich z.b. nicht durch apple.de ersetzen.

MFG Maxi
 
in meinem RegExpr war ein kleiner Fehler, Google formatiert die große Zahlen mit einem Punkt, dies hatte ich nicht berücksichtigt. So sollte es funktionieren.
PHP:
function in_google_index ($domain)
{
    $google_result = file_get_contents("http://www.google.de/search?q=".$domain);
    #echo $google_result;
    preg_replace_callback("/(.*)(von ungef(.+){1}hr <b>)([0-9\.]+)(<\/b>)(.*)/Usi", "in_index_callback", $google_result);
}

function in_index_callback ($erg)
{
    #echo print_r($erg);
    echo "Im index: ".$erg[4]." Seiten.<br />\n";
}

in_google_index("apple.de");
 
Es hat zwar nicht direkt mit dem Thema zu tun, aber ich wäre an deiner Stelle auch sehr, sehr vorsichtig, was das Stehlen von Daten anderer Webseiten betrifft! Soetwas kann schnell in einer Anzeige und Klage enden. Schadensersatzzahlungen von mehreren 10 000 € können davon die Folge sein... also sei vorsichtig damit und frage vorher lieber einmal bei Google nach ;)
 
Zuletzt bearbeitet:
An google-Suchergebnisse zu kommen ^^? Nein -> es sei denn du findest ein Gadget von Google (welches du deiner Webseite hinzufügen kannst http://www.google.de/ig/directory?hl=de )
Aber, wie bereits geschrieben: Du kannst auch einfach bei Google nachfragen ;) die werden dir schon antworten. Du solltest nur betonen, dass du NUR die ZAHL der Suchergebnisse auf deiner Webseite anzeigen möchtest, keine Suchergebnisse. Das dürfte sie überzeugen, dass du in gewisser Weise nur Werbung für sie machst ;)
 
Oder, kann ich irgendwie selbst, ohne google, an so ne zahl rankommen? Zum Beispiel mit nem Crawler ?
Das muss doch irgendwie gehen?

MFG Maxi
 
Google IST ein Crawler ^^
Bzw das Unternehmen benutzt einen Crawler um die Inhalte aller Websites zu erfassen und diese in einer Datenbank zu hinterlegen...
Die letztlichen Suchergebnisse die google ausgibt sind demnach auch nur statische erhebungen und keinen tatsächlichen Angaben, da deren Crawler nicht so der fixeste ist

Abgesehen davon brauch einCrawler auch ein bisschen Leistung seitens des Servers
 
DES ServerS? Google besteht nicht nur aus einem Server, sondern sehr, sehr vielen die miteinander zusammen arbeiten ;) z.B. würde wohl kaum ein Spider/Bot (oder auch Webcrawler) auf dem selben Server laufen, auf welchem das PageRanking läuft :rolleyes:
Außerdem funktioniert der Webcrawler von Google doch ein bisschen anders und komplexer, als maxikeys crawler, der nur eine bestimmte Zahl einer bestimmten Seite ermittelt.
Natürlich kann der Google-Suchbot (oder auch Crawler) nicht jeden Seiteneintrag rund um die Uhr auf dem aktuellsten Stand halten, dazu sind es zu viele. Google aktualisiert jedoch Seiten, die im Ranking sehr hoch stehen. So z.B. dieses Forum ;) (womöglich findest du diesen Thread schon über die google-Suche) Bei anderen Seiten schaut der Bot alle paar Monate vorbei ;)

Das nur als keine Information am Rande, wo dieses Thema einmal angeschnitten wurde :rolleyes:

Zu deiner Frage maxikey, einfach formlos eine eMail an sie schreiben und fragen, ob sie einverstanden sind, wenn du die Zahl ihrer Suchergebnisse speicherst ;)
Aber wie Chaosengel_Gabriel bereits angesprochen hat, sind diese Zahlen häufig nicht besonders aktuell :rolleyes:
 
Zurück