YaCy als lokale Suchseite für PDF incl. Vorschau?

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

YaCy als lokale Suchseite für PDF incl. Vorschau?

Beitragvon AndyMu » Mo Apr 13, 2015 12:04 pm

Hallo *,

ich bin ganz neu hier und gerade durch ein wenig Internetrecherche auf YaCy aufmerksam geworden.
Was ich bisher gelesen habe, kommt dem was ich suche, schon recht nahe.

Ich betreibe einen root Ubuntu Server, auf dem ich eingescannte Dokumente per OCRmyPDF in indexierbare PDFs umwandle. Diese liegen auf einem entsprechenden Verzeichnis auf dem Server.
Als nächstes bin ich auf der Suche nach einer Software (webbasiert), die mir jetzt diese PDFs durchsucht und Treffer auflistet.
Ich möchte mir somit ein kleines, einfaches Dokumentenmanagement-System aufbauen.
Jetzt würde ich gerne YaCy dafür verwenden, diese PDFs zu indexieren und über die Suchmaske zu finden. Bis hier hin, glaube ich, ist noch alles ok.

Da die Dokumente aber leider keinen sprechenden Namen haben, sondern nur ihr Scandatum im Namen, wäre eine Vorschau der PDF Dateien super... bisher hab ich aber nichts gelesen, dass es das gibt.

Bin ich mit YaCy gut bedient, oder kennt evtl. jemand eine für meinen Zweck geeignete Lösung (speziell das Thema Vorschau)?

Danke vielmals!

Gruß,
Andy
AndyMu
 
Beiträge: 2
Registriert: Mo Apr 13, 2015 11:57 am

Re: YaCy als lokale Suchseite für PDF incl. Vorschau?

Beitragvon Orbiter » Mo Apr 20, 2015 10:40 pm

Hi, das Szenario passt gut zu YaCy aber eine PDF-Vorschau gibt es nicht. Dafür gibts aber Suchergebnis-Snippets wie bei Webseiten auch, so dass die Namen der PDFs eigentlich egal ist. YaCy identifiziert im PDF auch Titel und zeigt die an, jedenfalls sollte das so laufen. Manchmal werden solche größere PDF-Mengen aber auch von Programmen erzeugt, die den Titel nicht richtig setzten, dann heisst alles 'Document Scan' oder so. In dieser Hinsicht kann YaCy noch nicht einen Alternativen Titel finden.

Du müsstest das ganze einfach mal ausprobieren und schauen wie gut du mit den Snippets zurecht kommst.
Orbiter
 
Beiträge: 5787
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: YaCy als lokale Suchseite für PDF incl. Vorschau?

Beitragvon AndyMu » Mi Apr 29, 2015 9:18 am

Hallo Orbiter,
super, dann werde ich mir das mal ansehen... Snippets sind dann quasi Textschnipsel, die mit angezeigt werden? Damit sollte tatsächlich eine Eingrenzung auf das richtige Dokument möglich sein.
Danke Dir!
AndyMu
 
Beiträge: 2
Registriert: Mo Apr 13, 2015 11:57 am


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast