✔ kleiner Crawler

maxikey · 23. Juni 2008

Ich rede nicht von $domain sondern von :
in_google_index("nepda.de");
Das nepda.de kann ich z.b. nicht durch apple.de ersetzen.

MFG Maxi

nepda · 24. Juni 2008

in meinem RegExpr war ein kleiner Fehler, Google formatiert die große Zahlen mit einem Punkt, dies hatte ich nicht berücksichtigt. So sollte es funktionieren.

PHP:

function in_google_index ($domain)
{
    $google_result = file_get_contents("http://www.google.de/search?q=".$domain);
    #echo $google_result;
    preg_replace_callback("/(.*)(von ungef(.+){1}hr <b>)([0-9\.]+)(<\/b>)(.*)/Usi", "in_index_callback", $google_result);
}

function in_index_callback ($erg)
{
    #echo print_r($erg);
    echo "Im index: ".$erg[4]." Seiten.<br />\n";
}

in_google_index("apple.de");

Sturmrider · 25. Juni 2008

Es hat zwar nicht direkt mit dem Thema zu tun, aber ich wäre an deiner Stelle auch sehr, sehr vorsichtig, was das Stehlen von Daten anderer Webseiten betrifft! Soetwas kann schnell in einer Anzeige und Klage enden. Schadensersatzzahlungen von mehreren 10 000 € können davon die Folge sein... also sei vorsichtig damit und frage vorher lieber einmal bei Google nach

maxikey · 25. Juni 2008

OK! Gibt es dann noch Alternativen wenn das so gefährlich ist ?

MFG Maxi

Sturmrider · 25. Juni 2008

An google-Suchergebnisse zu kommen ^^? Nein -> es sei denn du findest ein Gadget von Google (welches du deiner Webseite hinzufügen kannst http://www.google.de/ig/directory?hl=de )
Aber, wie bereits geschrieben: Du kannst auch einfach bei Google nachfragen

die werden dir schon antworten. Du solltest nur betonen, dass du NUR die ZAHL der Suchergebnisse auf deiner Webseite anzeigen möchtest, keine Suchergebnisse. Das dürfte sie überzeugen, dass du in gewisser Weise nur Werbung für sie machst

maxikey · 25. Juni 2008

Oder, kann ich irgendwie selbst, ohne google, an so ne zahl rankommen? Zum Beispiel mit nem Crawler ?
Das muss doch irgendwie gehen?

MFG Maxi

Chaosengel_Gabriel · 25. Juni 2008

Dazu müsstest du dir theoretisch ein zweites google schreiben ^^

maxikey · 25. Juni 2008

Ich dachte so was geht mit nem Crawler
Ich muss doch irgendwie an diese Daten kommen?

MFG Maxi

Chaosengel_Gabriel · 25. Juni 2008

Google IST ein Crawler ^^
Bzw das Unternehmen benutzt einen Crawler um die Inhalte aller Websites zu erfassen und diese in einer Datenbank zu hinterlegen...
Die letztlichen Suchergebnisse die google ausgibt sind demnach auch nur statische erhebungen und keinen tatsächlichen Angaben, da deren Crawler nicht so der fixeste ist

Abgesehen davon brauch einCrawler auch ein bisschen Leistung seitens des Servers

Sturmrider · 25. Juni 2008

DES ServerS? Google besteht nicht nur aus einem Server, sondern sehr, sehr vielen die miteinander zusammen arbeiten

z.B. würde wohl kaum ein Spider/Bot (oder auch Webcrawler) auf dem selben Server laufen, auf welchem das PageRanking läuft

Außerdem funktioniert der Webcrawler von Google doch ein bisschen anders und komplexer, als maxikeys crawler, der nur eine bestimmte Zahl einer bestimmten Seite ermittelt.
Natürlich kann der Google-Suchbot (oder auch Crawler) nicht jeden Seiteneintrag rund um die Uhr auf dem aktuellsten Stand halten, dazu sind es zu viele. Google aktualisiert jedoch Seiten, die im Ranking sehr hoch stehen. So z.B. dieses Forum

(womöglich findest du diesen Thread schon über die google-Suche) Bei anderen Seiten schaut der Bot alle paar Monate vorbei

Das nur als keine Information am Rande, wo dieses Thema einmal angeschnitten wurde

Zu deiner Frage maxikey, einfach formlos eine eMail an sie schreiben und fragen, ob sie einverstanden sind, wenn du die Zahl ihrer Suchergebnisse speicherst

Aber wie Chaosengel_Gabriel bereits angesprochen hat, sind diese Zahlen häufig nicht besonders aktuell

✔ kleiner Crawler

maxikey

Erfahrenes Mitglied

nepda

Erfahrenes Mitglied

Sturmrider

Erfahrenes Mitglied

maxikey

Erfahrenes Mitglied

Sturmrider

Erfahrenes Mitglied

maxikey

Erfahrenes Mitglied

Chaosengel_Gabriel

Erfahrenes Mitglied

maxikey

Erfahrenes Mitglied

Chaosengel_Gabriel

Erfahrenes Mitglied

Sturmrider

Erfahrenes Mitglied

Neue Beiträge