Aktualisierungen

Hier finden YaCy User Hilfe wenn was nicht funktioniert oder anders funktioniert als man dachte. Bei offensichtlichen Fehlern diese bitte gleich in die Bugs (http://bugs.yacy.net) eintragen.
Forumsregeln
In diesem Forum geht es um Benutzungsprobleme und Anfragen für Hilfe. Wird dabei ein Bug identifiziert, wird der thread zur Bearbeitung in die Bug-Sektion verschoben. Wer hier also einen Thread eingestellt hat und ihn vermisst, wird ihn sicherlich in der Bug-Sektion wiederfinden.

Aktualisierungen

Beitragvon DrFrankenpeer » So Apr 27, 2008 6:53 pm

Wie verhällt sich die Software eigentlich bei Seiten die täglich aktualiesiert werden wie z.B. Heise oder Spiegel.de ? ?...
DrFrankenpeer
 
Beiträge: 7
Registriert: Sa Apr 26, 2008 9:21 pm

Re: Aktualisierungen

Beitragvon miTreD » So Apr 27, 2008 6:59 pm

verschoben nach "Probleme & Lösungen"
miTreD
 
Beiträge: 1241
Registriert: Mi Jun 27, 2007 11:35 am
Wohnort: /home

Re: Aktualisierungen

Beitragvon miTreD » So Apr 27, 2008 7:00 pm

DrFrankenpeer hat geschrieben:Wie verhällt sich die Software eigentlich bei Seiten die täglich aktualiesiert werden wie z.B. Heise oder Spiegel.de ? ?...
Was meinst Du genau? Willst Du wissen ob die seiten regelmäßig automatisch von YaCy erfasst werden oder was YaCy macht, wenn es eine solche Seite innerhalb kurzer Zeit mehrfach vorgelegt bekommt?
miTreD
 
Beiträge: 1241
Registriert: Mi Jun 27, 2007 11:35 am
Wohnort: /home

Re: Aktualisierungen

Beitragvon DrFrankenpeer » So Apr 27, 2008 7:15 pm

Neee, schon richtig verstanden...erfasst YaCy die automatisch ???
DrFrankenpeer
 
Beiträge: 7
Registriert: Sa Apr 26, 2008 9:21 pm

Re: Aktualisierungen

Beitragvon DrFrankenpeer » So Apr 27, 2008 7:17 pm

.....hmmm ich frage mich gerade wo bekomm ich das Geld für ein eigenes Rechenzentrum her ;-)
DrFrankenpeer
 
Beiträge: 7
Registriert: Sa Apr 26, 2008 9:21 pm

Re: Aktualisierungen

Beitragvon Lotus » So Apr 27, 2008 7:37 pm

Beim Crawlstart (expert) kannst du es konfigurieren.
Wenn du via Proxy prefetch indexierst werden die neuen News erfasst, da der Link noch nicht bekannt ist.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: Aktualisierungen

Beitragvon miTreD » Mo Apr 28, 2008 9:44 am

Lotus hat geschrieben:Beim Crawlstart (expert) kannst du es konfigurieren.
Da gibt's die Option "Re-crawl known URLs:" und weil es da immer wieder zu Missverständnissen kommt, hier die kurze Erläuterung dazu: Die Option bewirkt NICHT das eine bestimmte Seite alle X Stunden/Tagen/Wochen etc. automatisch gecrawlt wird. Sie BEWIRKT lediglich, dass eine BEKANNTE Seite nochmals INDEXIERT werden DARF, falls sie älter als der eingestellte Zeitraum ist.
Lotus hat geschrieben:Wenn du via Proxy prefetch indexierst werden die neuen News erfasst, da der Link noch nicht bekannt ist.
Ich glaube, dass alles auf Ebene 0 über den Proxy grundsätzlich indexiert wird, auch wenn die URL schon bekannt ist. Kann das sein?
miTreD
 
Beiträge: 1241
Registriert: Mi Jun 27, 2007 11:35 am
Wohnort: /home

Re: Aktualisierungen

Beitragvon Orbiter » Mo Apr 28, 2008 11:47 am

miTreD hat geschrieben:Ich glaube, dass alles auf Ebene 0 über den Proxy grundsätzlich indexiert wird, auch wenn die URL schon bekannt ist. Kann das sein?

Ja.
Die Regel, ob eine Seite geladen wird ist im Crawler und im Proxy unterschiedlich:
- crawler: Alter der Seite in LURL + Recrawl-Option (an oder aus, und welche Zeit)
- proxy: cache stale/cache fresh. Wenn cache stale wird die Seite für den Browser aus dem Netz geladen.
für beide Fälle gilt: ist die Seite erst mal geladen, und sind die Indexing-Flags für Text oder Media an, so wird auch indexiert.

D.h. beim Proxy:
- wird die Seiten für den Browser auf dem HTCACHE geladen wird NICHT indexiert
- wird die Seite aus dem Netz geladen wird indexiert.
Orbiter
 
Beiträge: 5792
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Aktualisierungen

Beitragvon Lotus » Di Apr 29, 2008 8:01 am

Ich hänge mich hier einmal an.
Mir scheint die Neuindexierungszeit bei den Suchergebnissen zu hoch eingestellt (wenn sie überhaupt existiert). Wenn ich z.B. nach meinem vollen Namen suche bekomme ich weniger Ergebnisse als wenn ich nach meinem Nachnamen suche, obwohl mein Vorname auch in den Snippets zu finden ist. Um diesen Verknüpfungsschwund zu kompensieren sollten die gefundenen Suchergebnisse früher neu indexiert werden. Mein Vorschlag wäre 5 Tage.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Fragen und Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast