Informationen zum YACY DHT-Format

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Informationen zum YACY DHT-Format

Beitragvon rb-search » Fr Jan 06, 2012 10:33 pm

Welche Daten werden in der DHT Datenbank gespeichert und zu anderen Peer ausgetauscht?
Sind durch diese Daten Rückschlüsse auf den ursprünglichen Peer möglich, der den Crawl ursprünglich durchgeführt und die Hash - Link Tabelle erzeugt hat?

Vielen Dank für die Antwort.

rb-search
rb-search
 
Beiträge: 2
Registriert: Fr Jan 06, 2012 10:16 pm

Re: Informationen zum YACY DHT-Format

Beitragvon Orbiter » Sa Jan 07, 2012 5:00 am

das ist tatsächlich eine wichtige Frage: kann man den Erzeuger identifizieren.

Die Antwort ist NEIN. Ich hatte beim Entwurf der Datenstrukturen mir diese Frage gestellt und es wäre leicht gewesen diese Information zu produzieren. Allerdings wollte ich diese Rückverfolgungsmöglichkeit nicht haben, auch wenn dies erhebliche Vorteile bei einem Säuberungsprozess gehabt hätte, wo man dann einfach einen 'Spam-Peer' identifiziert und dessen URLs löscht.
Diese Möglichkeit bietet sich hier nun nicht.

Die Datenstruktur für die Metadaten an einem URL finden sich im Package net.yacy.kelondro.data.meta, bzw. die Klasse URIMetadataRow, da kann man sehen dass nichts einen Erzeugeerhash speichert. Was aber sehr wohl gespeichert wird ist der referrer, das ist aber nicht der Peer sondern eine andere Webadresse die auf die Adresse der Metadaten verwiesen hat.
Orbiter
 
Beiträge: 5797
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron