Index Browser

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Index Browser

Beitragvon brandy » Sa Feb 28, 2015 3:52 pm

Hallo!

Bin seit gestern begeisteter Senior bei Yacy.
Eins interessiert mich aber - Im Index Browser werden ja abertausende Websiten dargestellt.
Kratzt sich Yacy diese rein aus meinen gecrawlten Seiten zusammen?

Vielen Dank!
brandy
 
Beiträge: 5
Registriert: Do Feb 26, 2015 1:40 pm

Re: Index Browser

Beitragvon Micki » Sa Feb 28, 2015 4:56 pm

Schau mal unter Crawler Überwachung
in der Mitte unter Indexgröße Dokumente.
Die Zahl daneben zeigt die Menge deiner indexierten URL's / Dokumente "Achtung nicht Domains" an.

LG.
Micki
Micki
 
Beiträge: 86
Registriert: Sa Feb 21, 2015 10:38 pm

Re: Index Browser

Beitragvon Orbiter » Sa Feb 28, 2015 5:02 pm

Ich vermute mal die Frage geht auch in Richtung P2P: der Index Browser zeigt ausschliesslich an, was in deinem eigenen Index ist. Insofern ist die Antwort 'ja'.
Orbiter
 
Beiträge: 5769
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Index Browser

Beitragvon brandy » Sa Feb 28, 2015 5:47 pm

Wahnsinn...
Echt interessant was da zusammenkommt!

Vielen Dank!
brandy
 
Beiträge: 5
Registriert: Do Feb 26, 2015 1:40 pm

Re: Index Browser

Beitragvon brandy » So Mär 01, 2015 5:47 pm

Jetzt ist mir nochwas aufgefallen:
In meinem Index-Browser befinden sich auch Pornoseiten.
Ich hab schon im Forum recherchiert und grundsätzlich wäre es ja nicht im Sinne einer freien Suchmaschine so etwas zu reglementieren - aber könnte es rechtlichte Probleme geben weil man hierzu etwas gespeichert hat?
Grundsätzlich sind sie mir eh egal - irgendjemand wird schon Interesse daran haben diese zu crawlen - mich interessiert nur, ob es hier für mich zu Problemen kommen kann, nur weil etwas auf meinem Computer ist?

Vielen Dank!
brandy
 
Beiträge: 5
Registriert: Do Feb 26, 2015 1:40 pm

Re: Index Browser

Beitragvon Orbiter » So Mär 01, 2015 8:42 pm

du hast ja sowieso keinen Bildcontent, das lädt YaCy normalerweise nicht runter. Textcontent hast du nur wenn du das selbst gecrawlt hast. Und Porno ist nun mal im Internet - Überraschung! Du kannst natürlich auf deinem Peer löschen wie du magst, dafür gibt es die Blacklists und auch das Löschinterface kannst du automatisieren.

Beispiel: wenn du alles löschen willst wo das Wort 'xxx' auf der Webseite vorkommt, machst du:
- /IndexDeletion_p.html aufrufen
- im Feld 'q' unter "Delete by Solr Query" eintragen: text_t:xxx
- 'Simulate Deletion' drücken
- dann siehst du wieviele gelöscht werden würden und 'Engage Deletion' wird aktiviert
- wenn du dann auf 'Engage Deletion' drückst, sind die weg
- dann kannst du unter /Table_API_p.html dir den Vorgang raussuchen (steht dann ganz unten) und den Scheduler aktivieren und das ganze automatisiert wiederholen lassen
Orbiter
 
Beiträge: 5769
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Index Browser

Beitragvon brandy » So Mär 01, 2015 9:28 pm

Cool - danke!
brandy
 
Beiträge: 5
Registriert: Do Feb 26, 2015 1:40 pm


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron