Option Teile einer Seite nicht indizieren

Ideen und Vorschläge sind willkommen.

Option Teile einer Seite nicht indizieren

Beitragvon Lotus » Sa Jan 31, 2009 10:23 am

http://www.geekzilla.co.uk/ViewC8614968 ... DAC412.htm

Es wäre sicher auch in YaCy gut per HTML-Tags Teile einer Seite von der Suche ausschließen zu können.
Z.B. <!--yacyoff: index--> nicht indexiert <!yacyon: index--> ;)
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Option Teile einer Seite nicht indizieren

Beitragvon Orbiter » So Feb 01, 2009 1:50 am

interessant das es sowas bei den enterprise appliances gibt. Aber bist du sicher das man das gebrauchen kann? Ich meine damit, du musst ja alle Dokumente dazu bearbeiten. Wäre es nicht sinnvoller einen globalen Flag zu haben, wie beispielsweise bestimmte html-Bereiche nicht zu indexieren?

Das hier könnte man hiermit
viewtopic.php?p=12514#p12514
in Einklang bringen, und zwar insofern dass man für YaCy global definiert was an html-Informationen in den Index soll, und was man anzeigen möchte. Das hat ja was miteinander zu tun, oder nicht?
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Option Teile einer Seite nicht indizieren

Beitragvon Lotus » So Feb 01, 2009 11:22 am

Ich habe das im heise.de-Quelltext gefunden, das habe ich vergessen im ersten Post zu schreiben.

Eine Begrenzung durch class Attribute wäre einerseits am einfachsten an vorhandenen Seiten anzuwenden, andererseits auch weniger flexibel, da Attribute durchaus mehrfach vorkommen können. Beides wäre eine Aufwand-Nutzen Abwägung. Bei den Attributen wäre der Aufwand gering, das Resultat aber eventuell suboptimal. Bei zusätzlichen Tags wäre der Aufwand höher, das Resultat aber wie gewollt.
Ein zusätzliches yacy-Attribut wäre wohl am einfachsten. Z.B. class="any,yacy-noindex". Andererseits muss das bei mehreren aufeinanderfolgenden Textpassagen evtl auch mehrfach hintereinander aufgenommen werden. Dann wären Kommantar-Tags wiederum besser geeignet.
Nach meiner Auffassung kommt ohnehin niemand darum herum seine Seiten anzupassen, wenn er nur Teile davon indexieren möchte. Egal, welche Lösung benutzt wird.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron