Funktionsweise von Spam-Bots?

was weder zu YaCy noch zum Thema Suchmaschinen gehört

Funktionsweise von Spam-Bots?

Beitragvon Orbiter » Fr Apr 22, 2011 12:07 am

Heute hatten wir fünf interessante Postings eines 'users' Namens abendrise der von der IP 122.169.49.157 (DNS Eintrag zeigt auf einen Server in Indien) aus abgeschickt wurde. Der User hatte eine Mail-Adresse @gmail (mit gleichem nick). Zwei Meldungen hatten geziehlt Spam-Links drin und wurden schon von lulabad und Vega bearbeitet (verwarnt, gesperrt) und low012 hat dann noch folgende Vermutung geäussert, die ich mal ohne Marc zu fragen wohl zitieren darf:
Marc hat geschrieben:Ich glaube, den Nutzer "abendrise" ist ein Bot. Die Beiträge beziehen sich zwar irgendwie auf das Thema des Threads, es sieht aber so aus, als wird einfach mit einer Suchmaschine irgendwas zum Thema gesucht und dann in die Deutsche Sprache übersetzt. Ich denke mal, dass später dann einzelne Wörter durch Spam-Links ersetzt werden.

Ich denke so muss es sein und denke weil abendrise ein bot ist kann man seine postings löschen statt im nicht-zensieren-Modus nur zu 'ertragen'. Weil dieser bot aber offenbar so geschickt gestrickt ist dass man diese Technik mal genauer angucken sollte möchte ich ein Posting von abendrise hier mal bewahren und den Vorgang somit dokumentieren, anstatt einfach alles zu löschen:

Im Forums-Thread über Open Source Suchmaschinen im Vergleich stand:
abendrise hat geschrieben:Interessanter Vergleich von Open Source Suchmaschinen zur Verfügung, während es spiegelt OK auf Lucene (hey, wir können nicht an alles perfekt,) Ich bin daran interessiert herauszufinden, weitere Details über die Einstellungen wurden für die Indizierung verwendet. Wenn sie verwendet nur die out of the box Einstellungen, dann würde ich argumentieren, dass sie sich ein wenig Zeit damit verbringen, die richtigen Einstellungen für die Indizierung zur Optimierung Indizierung Geschwindigkeit benötigen. Außerdem ist es ziemlich schwer zu machen Äpfel-for-Äpfel Vergleiche von Suchmaschinen die verschiedenen Analyseverfahren gegeben, etc. Jede Suchmaschine wird mit ziemlicher Sicherheit haben ihren eigenen Weg Tokenerstellung, etc. Also, während aus der Box ist ein Vergleich Ausgangspunkt, es sollte nicht der Endpunkt sein. Schließlich ist Lucene 2,3 Formgebung bis zu beschleunigen Indizierung erheblich. Ich persönlich habe es bei ~ 5 mal schneller als 2,2 dank der neuen Indexierung Code von Michael McCandless Benchmarking. Es enthält auch bessere Kontrollen für die Speichernutzung während der Indizierung. Also, es wäre wirklich interessant zu Wiederholung der Experimente in dieser Arbeit wieder für Lucene 2.3, sobald es losgelassen wird.

Die benutzen offenbar sowas wie Pattern Matching um passende Texte zu finden, diese werden dann automatisch in die Sprache des Forums übersetzt und automatisch gepostet? Kann jemand den Originaltext hierzu finden?

Wir hatten ja schon öfters so Dinger hier im Forum und ich hab sie dann mitsamt dem User gelöscht. Es ist aber vielleicht ganz interessant zu wissen wie solche Bots denn funktionieren, dann kann man besser bei neuen misteriösen Postings einschätzen ob man da nur 'leicht verwirrte' Leute hat oder einen Bot.

Marc ist ja auch schon mal in seiner bewundernswerten liebenswerten Art auf so ein Posting reingefallen so weit ich mich erinnere. Ich wollte auch schon nett sein zu dem Bot aber irgendwie hat dann auch ein Kommentar in einer Meldung die Sachlage ganz gut erklärt und ich hab dann das Posting gelöscht. Wenn sowas wieder passiert versuche ich den Vorgang dann hier unter diesem Topic nochmal zu dokumentieren. Wer weiss was man daraus jetzt wieder lernen kann.
Orbiter
 
Beiträge: 5796
Registriert: Di Jun 26, 2007 10:58 pm
Wohnort: Frankfurt am Main

Re: Funktionsweise von Spam-Bots?

Beitragvon PCA42 » Fr Apr 22, 2011 7:01 am

PCA42
 
Beiträge: 621
Registriert: Mi Jan 23, 2008 4:19 pm
Wohnort: @Home

Re: Funktionsweise von Spam-Bots?

Beitragvon PCA42 » Fr Apr 22, 2011 10:35 am

PCA42 hat geschrieben:Hier ist die Quelle: http://lucene.grantingersoll.com/2007/1 ... omparison/.


Edit: Der Link wird auch ziemlich weit oben bei Google ausgeworfen, wenn man das Thema des Forenbeitrags "Open Source Suchmaschinen im Vergleich" bei Google reingibt und auch übersetzte Ergebnisse zuläßt. Jetzt kann man mal schauen, ob in den anderen Beiträgen betroffenen Beiträge ähnlich verfahren wurde.
PCA42
 
Beiträge: 621
Registriert: Mi Jan 23, 2008 4:19 pm
Wohnort: @Home

Re: Funktionsweise von Spam-Bots?

Beitragvon Low012 » Fr Apr 22, 2011 10:52 am

Orbiter hat geschrieben:Marc ist ja auch schon mal in seiner bewundernswerten liebenswerten Art [...]


Schön, wie du das Wort "naiv" vermeidest! ;-)

Wenn man "Open Source Suchmaschinen im Vergleich" mit http://translate.google.de/ übersetzt, bekommt man "Open source search engine in comparison". Wenn man das dann bei http://www.bing.com/ sucht (ohne Anführungszeichen), ist die Seite gleich das erste Ergebnis.
Low012
 
Beiträge: 2214
Registriert: Mi Jun 27, 2007 12:11 pm

Re: Funktionsweise von Spam-Bots?

Beitragvon Lotus » Fr Apr 22, 2011 8:30 pm

Ich bin quasi auch auf ihn hereingefallen. Ich wollte ihm eine Nachricht schicken, dass Englisch hier auch ok ist. Dann sah ich allerdings, dass schon 2 Verwarnungen vorhanden waren und habe in den Notizen gesehen, dass es wohl ein Bot ist und er schon gesperrt ist.
Lotus
 
Beiträge: 1699
Registriert: Mi Jun 27, 2007 3:33 pm
Wohnort: Hamburg


Zurück zu Off-Topic

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste