nach Datum suchen oder Index auslesen

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

nach Datum suchen oder Index auslesen

Beitragvon annalynx » So Dez 28, 2014 9:55 pm

Hallo zusammen,

ich bin neu hier und habe keine Ahnung :)
Ich brauche für ein Projekt Informationen der folgenden Art: auf Website X [Y,Z...], aber nur im Text, wurde im Jahr 2000 [2001,2002...] n mal das Wort 'Eisbär' ['Braunbär','Nasenbär',...] geschrieben. Ich habe die Seiten jetzt von YaCy crawlen und indexieren lassen und die Suche läuft auch. Wie kann ich aber gezielt nach Treffern in einem Zeitraum suchen?

Wenn das nicht geht: Gibt es eine Möglichkeit, den Index auszulesen oder in ein lesbares Format zu exportieren?
Ich habe gesehen, dass geparste Sätze und die Texte usw. in der GUI sichtbar sind - kann ich das für viele Seiten auf einmal exportieren? Manuelles Copy & Paste scheidet wegen mehreren 100 000 Seiten leider aus...

Bin für jeden Hinweis dankbar und verschenke freundliche Smileys :)
annalynx
 
Beiträge: 3
Registriert: So Dez 28, 2014 9:44 pm

Re: nach Datum suchen oder Index auslesen

Beitragvon Orbiter » Mo Jan 12, 2015 12:54 am

es gibt tatsächlich seit kurzem eine Möglichkeit, nach Datum zu suchen. Dazu musst du vor dem Indexieren in /IndexSchema_p.html alle Felder die mit date_in beginnen anschalten. Diese Option ist zur Zeit nicht per default an, weil sie eine miserable Performance hat. Was es macht: es versucht in allen Dokumenten die Stellen von Datumsangaben zu finden, in mehreren verschiedenen Sprachen und vielen verschiedenen Schreibweisen. Die dazugehörigen regulären Ausdrücke verbraten recht viel CPU. Vielleicht fällt mir ja noch was anderes ein.

Wenn dann die Dokumente damit indexiert sind, kannst du in einer Suchanfrage die Formulierung "on:<date>" benutzen, und das Ergebnis wird dann auf das Datum eingeschränkt. Eine Einschränkung auf ein Zeitraum-Intervall gibt es noch nicht.

Ein Export ist so, wie du es willst nicht möglich und auch nicht sinnvoll. Benutze für detailierte Recherche das native Solr-Interface unter bsp. /solr/collection1/select?q=*:*&defType=edismax&start=0&rows=3
Orbiter
 
Beiträge: 5787
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: nach Datum suchen oder Index auslesen

Beitragvon lamite » Sa Jan 17, 2015 3:41 pm

Hallo,

im selben gedanken : ich möchte mehrere agendas mischen. Für eins gibt es ein RSS mit datum, ein andere muss geparst werden. Ist es möglich ein xpath fur das datum per crawl einzugeben ?
lamite
 
Beiträge: 1
Registriert: So Jan 11, 2015 9:23 pm

Re: nach Datum suchen oder Index auslesen

Beitragvon Orbiter » Mo Jan 19, 2015 5:34 pm

XPath und rss Datum sind keine schlechte Ideen.
Orbiter
 
Beiträge: 5787
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron