scans matching documents for links only / HrefOnly

Ideen und Vorschläge sind willkommen.

scans matching documents for links only / HrefOnly

Beitragvon henningb » Fr Nov 22, 2013 9:52 pm

Hallo,
entweder ich habe das noch nicht gefunden oder es gibt es nicht: Übersichtseiten sollen nicht indiziert werden, sondern nur die vorhandenen Links sollen verfolgt werden.

Ich habe eine zeitlang intensiv mit mngosearch gearbeitet, da hieß der Befehl HrefOnly (http://www.mnogosearch.org/doc33/msearc ... fonly.html).
Das ist eine feine Sache, weil der Index effizienter wird und weniger "Müll" vorhanden ist
henningb
 
Beiträge: 5
Registriert: So Nov 03, 2013 6:10 pm

Re: scans matching documents for links only / HrefOnly

Beitragvon Orbiter » Sa Nov 30, 2013 1:32 am

das Identifizieren, was eine 'Übersichtsseite' ist, kann (noch) nicht automatisch geschehen. Du kannst aber beim Crawl Start über den "Document Filter" ein Pattern angeben, wie die URL dazu aussehen soll. Wenn du beispielsweise eine einzlne URL hast, die die Übersichtsseite ist, dann schreibst du die innerhalb von "Document Filter" in "Filter on URLS" - "must-not-match" rein. Das sollte das Crawlen nicht verhindern, aber das Indexieren genau dieser Seite.

So weit ich das HrefOnly verstanden habe sollte das hier das gleiche sein.
Orbiter
 
Beiträge: 5786
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Wunschliste

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste

cron