YaCy als Suchmaschine für das OpenOffice.org Projekt im Test

Ereignisse, Vorschläge und Aktionen

YaCy als Suchmaschine für das OpenOffice.org Projekt im Test

Beitragvon r.bircher » Mi Nov 10, 2010 11:27 pm

Hallo zusammen

Ich war früher schon mal hier, und habe das Projekt immer wieder mal verfolgt. Ich bin im OpenOffice.org Projekt aktiv, und dort auch im int. Webprojekt engagiert. Also alles was mit irgendwelchen Tools und blabla zu tun hat. Seit längerem haben wir das Problem dass bei uns Inhalte nur sehr schwehr zu finden sind. Teilweise scheitern da sogar gestandene Mitglieder. Der Grund dafür ist relativ simpel. Bugtracker hier, Wiki da, Mailing List dort, Foren dadrüben. Dazu noch einiges selbst gestricktes oder stark angepasstes. Die meisten dieser Tools haben zwar eine Suchfunktion, aber wer geht schon an sieben stellen suchen ;-) Ausserdem sind die Bord suchmittel teils mehr als nur unbrauchbar.

Hinzu kommen noch ettliche ihhalte die wir aus Performance Gründen nicht für herkömmliche Suchmaschinen freigeben. Da ist der Griff zu YaCy doch naheliegend. Doch auch für YaCy ist der Weg noch weit zu einer Portalsuchmaschine für ein derart grosses Projekt.

Diverse Anpassungen müssen vorgenommen werden und die Suchmaschine für die Portalsuche optimiert werden. Zudem muss die Software grosse Performance bieten, denn wenn das ding mal produktiv läuft, wird es Suchanfragen hageln. OpenOffice.org hat rund 4 Mio Besucher am Tag.

Dennoch, wenn YaCy die Hürden nimmt, könnte das auch für YaCy einen sprung nach vorne bedeuten. 1. bei einem so grossen Projekt als SuMa zu fungieren, und zweitens wird man anschliessend bestimmt schlauer sein, was man bei einer Portalsuche alles zu berücksichtigen hat.

Vorallem auf das Projekt zurückgebracht hat mich die verbesserte Stabilität. Ein Prototyp von OOoSearch ist auf http://ooosearch.dyndns.org verfügbar. Aktuell habe ich rund 35'000 Seiten im Index. Schlussendlich werden es bestimmt über eine halbe Million.

Gruss Raphael
r.bircher
 
Beiträge: 36
Registriert: Mo Sep 15, 2008 8:52 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon linuxfan » Fr Nov 12, 2010 10:09 am

man Kann es ja auch für libreofice machen oder http://www.documentfoundation.org/download/
linuxfan
 
Beiträge: 8
Registriert: Sa Okt 23, 2010 10:12 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon Low012 » Fr Nov 12, 2010 10:43 am

r.bircher hat geschrieben:Dennoch, wenn YaCy die Hürden nimmt, könnte das auch für YaCy einen sprung nach vorne bedeuten. 1. bei einem so grossen Projekt als SuMa zu fungieren, und zweitens wird man anschliessend bestimmt schlauer sein, was man bei einer Portalsuche alles zu berücksichtigen hat.

Nicht nur bei der Portalsuche. Da dein Index viele Dokumente zu gleichen Themen in unterschiedlichen Sprachen enthält, habe ich gemerkt, was für Schwierigkeiten YaCy noch hat z.B. Spanisch und Französisch auseinander zu halten. :(
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon Lotus » Fr Nov 12, 2010 2:26 pm

Bei den Sprachen müsste es auch noch bei der Suche ein ODER-Mapping von Umlauten geben, bspw Maiziere findet auch Maizière. Irgendwo hier gibt es schon einen Thread dazu den ich nicht finde.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon r.bircher » Mo Nov 15, 2010 2:48 pm

linuxfan hat geschrieben:man Kann es ja auch für libreofice machen oder http://www.documentfoundation.org/download/


Können ja, aber ich werde es bestimmt nicht tun. Zudem, das Projekt ist ja noch nicht so alt, und hat durchaus (so hoffe ich) noch den Überblick über die Informationen. Warum ich LibreOffice nicht unterstütze will ich hier übrigens nicht diskutieren. Fact ist, OpenOffice.org und LibreOffice sind zwei Projekte, und es ist auch nicht so, dass die ganze Community zu LO abgewandert ist. Ich bleibe bei OOo
r.bircher
 
Beiträge: 36
Registriert: Mo Sep 15, 2008 8:52 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon r.bircher » Mo Nov 15, 2010 2:55 pm

Low012 hat geschrieben:
r.bircher hat geschrieben:Dennoch, wenn YaCy die Hürden nimmt, könnte das auch für YaCy einen sprung nach vorne bedeuten. 1. bei einem so grossen Projekt als SuMa zu fungieren, und zweitens wird man anschliessend bestimmt schlauer sein, was man bei einer Portalsuche alles zu berücksichtigen hat.

Nicht nur bei der Portalsuche. Da dein Index viele Dokumente zu gleichen Themen in unterschiedlichen Sprachen enthält, habe ich gemerkt, was für Schwierigkeiten YaCy noch hat z.B. Spanisch und Französisch auseinander zu halten. :(


Es ist in der Tat so, das der RWI ca 440 k Wörter umfasst, das bei 35 k Seiten. Es sind dabei geschätzt um die 110 Sprachen. Das dies neue Schwierigkeiten bei YaCy ans Tageslicht bringt ist doch gut :-)
Allerdings bringt es auch Fehler unserer HTML Seiten ans Tageslicht. Denn eigentlich sollten die Seiten mit einem Meta-Language Code versehen sein. Soweit die Theorie. ;-) Die Praxis wird wohl stark davon abweichen. Ich werde das demnächst auf der internationalen Website-Dev von OpenOffice.org zur Sprache bringen.

Gruss Raphael
r.bircher
 
Beiträge: 36
Registriert: Mo Sep 15, 2008 8:52 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon r.bircher » Mo Nov 15, 2010 2:59 pm

Hallo zusammen

Die erste kleine Hürde ist genommen. Der Peer läuft jetzt seit sieben Tage ohne Probleme durch. YaCy scheint also in der Grundstabilität ok zu sein. Allerdings hatte ich noch nicht viele Suchanfragen, die Performance wurde also noch nicht getestet. Das ist allerdings einer der nächsten Schritte.

Schönen Tag noch
Gruss Raphael
r.bircher
 
Beiträge: 36
Registriert: Mo Sep 15, 2008 8:52 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon Low012 » Mo Nov 15, 2010 6:29 pm

Hallo Raphael,

ich weiß nicht mehr genau, wann du das letzte Mal hier warst und was seitdem alles passiert ist, aber Michael (Orbiter) hat einen Menge Arbeit investiert, um die Suche im lokalen Index (was ja dein Usecase ist) schnell zu machen.

Ich glaube, er hat auch mal Lasttests gemacht, ich bin aber jetzt nicht mehr ganz sicher. Auf http://yacy.net/Suchportale.html sind in der rechten Spalte auch ein paar Beispiele zu sehen, wo YaCy mittlerweile als Suche eingesetzt wird.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon Quix0r » Mi Nov 17, 2010 2:30 am

Die DynDNS.org-Adresse gibt es noch? Jedenfalls bekomme ich dort eine Weiterleitung auf eine private IP-Adresse zu sehen.
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon r.bircher » Mi Nov 17, 2010 4:28 am

Funktioniert wieder, war ein Problem bei meinem DSL Router. hatte wohl etwas zu viel herumgebastelt ;-)
r.bircher
 
Beiträge: 36
Registriert: Mo Sep 15, 2008 8:52 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon Quix0r » Fr Nov 19, 2010 1:24 pm

Prima, klappt wieder. :)
Quix0r
 
Beiträge: 1345
Registriert: Di Jul 31, 2007 9:22 am
Wohnort: Krefeld

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon ribbon » Mo Nov 22, 2010 12:07 am

ich würde die suchmaschine ins office packet für die user packen und nicht für die developer.
ribbon
 
Beiträge: 212
Registriert: So Jan 06, 2008 4:23 pm

Re: YaCy als Suchmaschine für das OpenOffice.org Projekt im

Beitragvon george-fra » Do Nov 25, 2010 2:08 pm

ribbon hat geschrieben:ich würde die suchmaschine ins office packet für die user packen und nicht für die developer.

Super! Gute Idee - Zuvor muss einiges noch in Sachen LAIEN Anwenderfreundlichkeit - Usability getan werden. Folgende Stichworte - einfach nur meine Notizen , sorry "Rohware", könnten Wege hierzu aufzeigen :

„Eingabemaske für, und Ergebnispräsentation einer digitalen Suche sind Teil des Interfaces, hier muss der Dialog mit dem User beginnen! GN 101111

- Beachte den Unterschied zwischen Suchen und Surfen.

Sehr gutes Flowchart in IP-S , von Semantic Studios ( is an information architecture and user experience consulting firm led by Peter Morville http://findability.org . "We help our clients around the world to create better web sites, intranets, and interactive products and services.) " Siehe auch : Usability Test Anleitung :

http://www.ip-sharemedia.de/w/?attachment_id=599
Comic von http://www.userfocus.co.uk

Findability encompasses aspects of information architecture, user interface design, accessibility and search engine optimization , among others.

Findability can be evaluated via usability testing or tree testing.

<Quelle>Videos : The Future of Search http://www.ixda.org/resources/peter-morville-future-search Video : The Future of Search , 38 min . Search is among the most disruptive innovations of our time. It influences what we buy and where we go. It shapes how we learn and what we believe. It’s a wicked problem of terrific consequence and a radically cross-disciplinary, creative challenge. In this talk, we’ll define a pattern language for search that embraces user psychology and behavior, multisensory interaction, and emerging technology. We’ll identify design principles that apply across the categories of web, e-commerce, enterprise, desktop, mobile, social, and realtime. And, we’ll show how futures methods and user experience deliverables can help us to create better search interfaces and applications today, and invent the unthinkable discovery tools of tomorrow.</Quelle>

Ja es gibt da viel Spannendes zu tun - wer macht mit ? Usability + Marketing - No coding -

Mein erster Beitrag : Um diese o.g. Ziele professionel erreichen zu können, habe ich schonmal – mein, auch Unternehmer Invest – folgende Stelle als Master Abschlussarbeitsthema für BWL Studenten ( vorzugsweise / Zielrichtung : Innovationmanagement ) für vorerst 6 Monate mit Entgeld + mein Arbeitseinsatz, auf meine Kosten ausgeschrieben – Siehe Link:
Innovatives Wissensmanagement – Deine Thesis ?
http://www.ip-sharemedia.de/w/228/bachelor-masterthesis-diplomarbeitsthema/
( Das Angebot gerne auch weiterleiten oder posten – Danke )

Es gehört zu meinen Vorgehensweisen in den vers. Fachbereichen mit kompetenten Hochschulen und ihren FuE Einrichtungen bzw. Abschlussstudenten zusammenzuarbeiten.

Warum so intensiv? Weil ich an YaCy als ein Modul in unseren IP-S Wissensgärten glaube. Was mich treibt? Steht u.a. hier :
http://www.ip-sharemedia.de/w/590/wissen-teilen-erarbeiten-teilen-pflegen-ernten-teilen/

Schönes Wochenende - Georg
george-fra
 
Beiträge: 31
Registriert: So Sep 26, 2010 9:55 pm
Wohnort: Germany / Leipzig


Zurück zu Mitmachen

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast

cron