Crawl komplett rückgängig machen...?

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Crawl komplett rückgängig machen...?

Beitragvon dürer » So Feb 05, 2012 5:56 pm

Hallo zusammen. :)
ich nutze Yacy im Robinson-Mode für ein Themenportal. Nachdem ich 20 Seiten mit sehr geringer Tiefe und allen möglichen B eschränkungen (nur eigene domain usw.) indexiert habe, ist mir aber ein Crawl "rausgerutscht" der mir alle möglichen unerwünschten Seiten in den Index gespammt hat. (Tiefe 3 mit Erlaubnis auf externe Links)
Frage: Gibt es eine Möglichkeit einen gemachten Crawl komplett rückgängig zu machen, inklusive aller Links? Über die Indexverwaltung mit hashwerten und URL-Verwaltung habe ich es nicht hinbekommen.
Vielen Dank für Eure Antwort,
dürer
 
Beiträge: 11
Registriert: So Feb 05, 2012 5:49 pm

Re: Crawl komplett rückgängig machen...?

Beitragvon Quix0r » So Feb 05, 2012 8:03 pm

Ein paar Anreize von mir:
- Das "verantwortliche" Crawl-Profil rausloeschen (auch aus der API-Tabelle; alles unter /CrawlProfileEditor_p.html)
- Dann ueber die URL-Verwaltung (zwei Tabs) sich die TOP-100 Domains rausgeben lassen (das kann mal etwas dauern)
- Dann jede Domain, die du nicht haben willst rauswerfen und die TOP100 aktualisieren (mit zweiten Tabulator geht es besser)
Quix0r
 
Beiträge: 1347
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: Crawl komplett rückgängig machen...?

Beitragvon Lotus » Mo Feb 06, 2012 8:10 pm

Einen kompletten Crawl kann man derzeit nicht rückgängig machen. Das macht auch nur Sinn, solange keine Daten verteilt wurden (z.B. bei einer Inselinstallation), denn sonst lässt sich nichts mehr löschen.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Crawl komplett rückgängig machen...?

Beitragvon dürer » Di Feb 07, 2012 12:07 pm

Schon mal danke für Eure Antworten :)
@lotus: Ich glaube, ich tue das was du inselinstallation nennst (robinson). es ist ein themenportal ohne peer-austausch. Der Crawler wird also nur von mir mit URLs gefüttert. Insofern macht es Sinn für mich. :mrgreen:

@QuixOr
Das hat soweit schon mal geholfen. ich muss jetzt nur noch rausfinden, welcher Crawl mir diese URL eingebrockt hat, damit die URLs nicht wiederkehren.

Im Übrigen arbeite ich jetzt so, dass ich vor jeder neuen Fütterung ein Backup von DATA mache. nach der Fütterung wird dann getestet und im Notfall einfach das Backup zurückgespielt.
dürer
 
Beiträge: 11
Registriert: So Feb 05, 2012 5:49 pm


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast