Spiderbot Code

  • Themenstarter Themenstarter BlueCrush
  • Beginndatum Beginndatum
B

BlueCrush

Hi Jungs und Mädels :)

Ich versuche mich momentan an einer eigenen Suchmaschine, so wie ähnlich wie Google.
Die Suchmaschine soll nur für meine eigene Seite sein, und nun möchte ich mal hören was ihr von meinem jetzigen Code haltet.
Da ich noch nicht lange PHP Programmiere, weiss ich nicht ob der Code gut ist oder nicht.
Ich bin noch stark in der Entwicklungsphase, also ich denke noch lange nicht ans abschliessen.


Hier der Code:

PHP:
 <?
class spider
{
	 //Variablen Deklarieren
	 //Start URL
	 var $urls; 
	 //Aktuelle Suchtiefe
	 var $currentdepth;
	 //Erlaubte Suchtiefe
	 var $depth;
 
function spider($urls, $currentdepth, $depth)
{
//Variablen Initialisieren
$this->urls = $urls;
$this->currentdepth = $currentdepth;
$this->depth = $depth;
} 
 
function getLinks($urls)
{ 
while($this->currentdepth < $this->depth)
{ 
	 foreach($urls[$this->currentdepth] as $url)
	 {
		 //Aktuelle SuchTiefe erhöhen
		 $this->currentdepth++;
		 $text=implode("\n",file($url));
		 $plaintext = strip_tags($text);
		 //Suchmuster für Links
		 $pattern = '=^(.*)<a(.*)href\="?(\S+)"([^>]*)>(.*)</a>(.*)$=msi';
		 while (preg_match($pattern, $text, $txt))
		 {	 
			 $urls[$this->currentdepth][] = "$txt[3]";
			 //echo "<br>" . $urls[$this->currentdepth];
			 //echo "<a href=$txt[3]>$txt[5]</a><br>";
			 $text = $txt[1]." link erased ".$txt[5];
		 } 	 
	 } 
} 
$this->urls = $urls;
return $this->urls;
}
	function getContent($urls)
	{ 
	foreach($urls as $urlss)
		{
		foreach ($urlss as $url)
			{
			 echo "<br><br>$url<br><br>";
			 $text=implode("\n",file($url));
			 $plaintext = strip_tags($text);
			 echo $plaintext;
		 }
	 }
	}
}
?>

Und so wird das ganze Ausgeführt:

PHP:
 <?
include "class_spiderfunctions.php";
$urls[0][]= "http://www.google.ch";
$spider = new spider($urls, 0 , 1);
$spider-> getLinks($spider->urls);
$spider-> getContent($spider->urls);
?>

Und, was meint ihr!?
 
Zurück