Indexierung SMB Shares

Keine Scheu, hier darf alles gefragt und diskutiert werden. Das ist das Forum für YaCy-Anfänger. Hier kann man 'wo muss man klicken' fragen und sich über Grundlagen zur Suchmaschinentechnik unterhalten.
Forumsregeln
Hier werden Fragen beantwortet und wir versuchen die Probleme von YaCy-Newbies zu klären. Bitte beantwortete Fragen im YaCy-Wiki http://wiki.yacy.de dokumentieren!

Indexierung SMB Shares

Beitragvon clipboard » Sa Mai 17, 2014 7:32 pm

Hallo,

ich bin durch einenTipp ganz neu mit Yacy in Berührung gekommen. Ich bin ehrlich, die http Indexierung ist zwar toll und habe ich ausprobiert. Sie ist für mich aber nicht so spannend. Mich juckt die File Indexierung, speziell via SMB. Nun habe ich etliches versucht, kriege es aber nicht auf die Reihe.

Ich habe:

    Ein funktionierendes Active Directory mit einem kleinen (Test) Server, der ein paar SMB Shares zur Verfügung stellt. Für diese Shares habe ich AD Gruppen mit allen möglichen Rechten versehen.
    1x Mac, 1x Linux, 1x Windows, alle mit einem AD Join

Selbstverständlich läuft dann Yacy im Intranet Modus.

Nun führte ich erst auf Linux (Ubuntu, Mint beide sehr aktuell) Yacy aus und wollte per smb://host/share indexieren - geht nicht. Naja, die Frage ist natürlich mit was für Credentials mein Linux beim SMB Share daherkommt. Wahrscheinlich ja nicht mit den gleichen, wie ich am AD via Linuxclient authentifiziert bin. Ok nächster Versuch.

Das gleiche auf dem Mac, Yaci aufgeführt. Mac ist auch Member im AD und mit dem angemeldeten User bin ich am AD authentifiziert (inkl. Roaming Profile). Geht auch nicht. Selbiges Problem. Komisch ist nur, dass

Code: Alles auswählen
smb://user:pw@host/share
auch nicht geht.

Ok, nehmen wir einen Windowsclient. Hier sehe ich, dass Javagedöns :-) Prozesse unter meinem AD User laufen. Auf die Schnelle würde ich behaupten, dass die von Yacy stammen und somit eigentlich der Zugriff klappen müsste - ist aber nicht so.

Also, berechtigte ich auf einem Share mal mit Everyone. Und siehe da, es wurde eine Indexierung gemacht. Aber leider nur einmal und nachher nie wieder.
Besser wäre natürlich, wenn man bestimmen könnte unter welchem lokalen oder AD Benutzer der Crawl laufen soll.

Leider finde ich über dieses Thema im Forum nichts, auch nichts als Doku oder so. Aber vielleicht hat jemand einen guten Tipp?

Bin dankbar dafür
Fabian
clipboard
 
Beiträge: 3
Registriert: Fr Mai 16, 2014 6:17 pm

Re: Indexierung SMB Shares

Beitragvon Orbiter » Mo Jun 02, 2014 1:33 am

SMB shares mit Accounts zu indexieren läuft immer in die gleiche Logik: wenn man einen Account nimmt, brauch man den auch zum Suchen, sonst sind Suchergbnisse sinnlos. Dann müsste man den Account aber allen suchenden geben, damit wäre es überhaupt sinnlos einen Account zu nehmen.

Ein 'richtige' Lösung müsste im Suchinterface auch den suchenden authentifizieren und damit müsste in YaCy ein neues Auth-Modul rein, das z.B. ActiveDirectory-Verbindungen bauen kann. Das kann hier aber offenbar keine programmieren. Kannst du?
Orbiter
 
Beiträge: 5781
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Indexierung SMB Shares

Beitragvon clipboard » Mo Jun 02, 2014 10:14 am

vielen Dank für deine Antwort!

Andere Produkte im Windows-Umfeld indexieren mit einem hoch privilegiertem User. Damit dieser alles crawlen kann. Die Suchergebnisse werden aber nach entsprechenden Rechten des angemeldeten Users ausgegeben. Also mit den gleichen Rechten, die der User/Gruppe sowieso schon auf die Dateien hat.

Genau das hast du im letzten Satz eigentlich geschrieben. Das wäre eine "richtige" Lösung....

Wenn ich könnte, würde ich sofort helfen. Aber leider habe ich keinen Plan vom Programmieren.

Grüsse
clipboard
 
Beiträge: 3
Registriert: Fr Mai 16, 2014 6:17 pm

Re: Indexierung SMB Shares

Beitragvon gTSj » Mi Jun 04, 2014 11:24 pm

@clipboard: Nein, da bin ich anderer Meinung. Mit erhöhten Rechten für die Suche indizieren ist ein Sicherheitsrisiko, das man nicht eingehen sollte.
Es geht lediglich darum, sicher zu stellen, dass die Verbindung zum SMB share hergestellt ist, wenn die Indizierung stattfindet.
gTSj
 
Beiträge: 21
Registriert: Mo Jan 27, 2014 10:49 pm

Re: Indexierung SMB Shares

Beitragvon clipboard » Sa Jun 07, 2014 12:02 pm

gTSj, kein Problem wenn man anderer Meinung ist. Aber im MS Umfeld wird das in etwa so gemacht z.B. der Crawler von Sharepoint. Ich bin auch kein Fan davon. Alles was indexiert werden darf, bekommt darauf der Crawler die Rechte (lesen reicht ja eigentlich) auf den SMB-Share und/oder noch auf NTFS...

Aber eigentlich gehts mir auch nicht darum, ob das besonders gut ist oder nicht. Ich wollte eigentlich nur wissen, wie das mit yacy angefacht ist einen entfernten SMB-Share zu indexieren und habe dabei erklärt, wie ich es im Windows-Umfeld jeweils antreffe.

Leider habe ich das bis jetzt noch nicht hingekriegt. Leider....
clipboard
 
Beiträge: 3
Registriert: Fr Mai 16, 2014 6:17 pm


Zurück zu Hilfe für Einsteiger und Anwender

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron