Hallo!
Ich suche ein paar Tipps zu folgendem Problem.
Ich publiziere News in einem Blog und würde gerne den Zeitraum zwischen Erscheinungdatum der Quellnews und dem Post in meinem Blog verkürzen.
Jetzt möchte ich sozusagen per Skript oder mit einer Software (sofern es sowas gibt) diese Seiten crawlen, um festzustellen ob es etwas neues gibt, da nicht alle Quellseiten einen RSS-Feed anbieten. Es handelt sich um eine überschaubare Zielgruppe daher kann ich die in Frage kommenden Quellsites in einer Liste sammeln und den Crawl quasi begrenzen. Dabei möchte ich keinen Content klauen, sondern nur benachrichtigt werden wenn es eine Änderung gibt damit ich dann zeitnah einen Newsbericht verfassen kann.
Das Script soll also mehrmals am Tag die Quellseiten besuchen und mir mitteilen wenn es etwas neues gibt.
Da ich mich bisher nicht mit dem Thema Crawling befasst habe, suche ich ein paar Ideen, eventuell Scripte oder Software auf die ich aufbauen kann etc.
Danke, N.
Ich suche ein paar Tipps zu folgendem Problem.
Ich publiziere News in einem Blog und würde gerne den Zeitraum zwischen Erscheinungdatum der Quellnews und dem Post in meinem Blog verkürzen.
Jetzt möchte ich sozusagen per Skript oder mit einer Software (sofern es sowas gibt) diese Seiten crawlen, um festzustellen ob es etwas neues gibt, da nicht alle Quellseiten einen RSS-Feed anbieten. Es handelt sich um eine überschaubare Zielgruppe daher kann ich die in Frage kommenden Quellsites in einer Liste sammeln und den Crawl quasi begrenzen. Dabei möchte ich keinen Content klauen, sondern nur benachrichtigt werden wenn es eine Änderung gibt damit ich dann zeitnah einen Newsbericht verfassen kann.
Das Script soll also mehrmals am Tag die Quellseiten besuchen und mir mitteilen wenn es etwas neues gibt.
Da ich mich bisher nicht mit dem Thema Crawling befasst habe, suche ich ein paar Ideen, eventuell Scripte oder Software auf die ich aufbauen kann etc.
Danke, N.