it-swarm-vi.com

Điểm của thư rác vô nghĩa là gì

Tôi khá thường xuyên xảy ra trên các diễn đàn bị spam với các tin nhắn như:

Arugula (Eruca sativa) là một màu xanh lá cây hàng quý, giả vờ hoặc đá. Đó là thời truyền thống, overclever 20 căn hộ rất hữu ích cho phong trào "ăn uống". Trước khi trở ngại những năm 1990, sự hồi hộp đã được thu hoạch hoang dã nước ngoài. Màu sắc đã nhập tịch thế giới phản động, trên tất cả mọi thứ ở châu Âu ngoài Bắc Mỹ. Arugula là tất cả các khu vực Địa Trung Hải tròn, cách xa Morocco và Bồ Đào Nha, phía đông Lebanon cộng với Thổ Nhĩ Kỳ. Roughly Ấn Độ, hạt giống trưởng thành là Garsher songeffortless. Dung môi là gia đình scour (Brassicaceae), que là một tên lửa khá xa, là công cộng ...

Mục đích đằng sau thư rác như vậy là gì? Thật khó chịu, đúng vậy, nhưng người ta cho rằng người gửi thư rác có mục đích nào đó ngoài mục đích đơn giản là khó chịu để đi đến nỗ lực làm việc này. Tôi không thấy bất kỳ URL hoặc liên kết nóng nào trong tin nhắn và không có định dạng "hài hước" rõ ràng nào có thể khai thác điều gì đó.

Đây có phải là bằng cách nào đó cố gắng để ảnh hưởng đến trình thu thập dữ liệu web? (Và, nếu vậy, nhằm mục đích gì?) Nó bằng cách nào đó khai thác một số điểm yếu trong phần mềm diễn đàn? Gì?

Đã thêm: Không thực sự liên quan đến câu hỏi ban đầu - thêm một nhận xét tiếp tuyến, nhưng tôi nghĩ rằng sẽ rất đáng để giữ nó ở cùng một vị trí, trong trường hợp người khác đến tìm:

Bản chất của các bài đăng "lạ" trên diễn đàn mà tôi chủ yếu nghĩ về ( http: // forums.finehomebu già.com / ) đã thay đổi phần lớn. Những gì chúng ta nhận được bây giờ (một lần/hai lần một tuần) là những bài đăng vẹt chi tiết từ các bài viết trước trong chuỗi (thường là một chủ đề rất cũ) hoặc có thể là chi tiết thu được từ tìm kiếm trên web về chủ đề của chủ đề, nhưng chúng thường vô nghĩa (tại tốt nhất là bản chất "tôi cũng vậy" và tiếng Anh, trong khi về mặt kỹ thuật, là một mái tóc và rõ ràng không phải là một người nói tiếng Anh (không phải người Anh, người Mỹ, người Ấn Độ, hay người châu Phi, tất cả những phương ngữ mà tôi ít quen thuộc nhất với).

Dự đoán tốt nhất của tôi là đây là những người, có lẽ ở Trung Quốc, đang học tiếng Anh và đang sử dụng diễn đàn như một bài kiểm tra, để xem bài đăng của họ có bị phát hiện không. Tuy nhiên, tôi không biết nếu đây chỉ đơn giản là một trò chơi, một bài kiểm tra cho một lớp học tiếng Anh hoặc một bài kiểm tra/thực hành cho một người gửi thư rác Wannabe. .

Nhưng chờ đã - còn nữa !!

Trong khoảng một năm qua, diễn đàn mà tôi nói chuyện thường xuyên (ít nhất là hàng tuần, và đôi khi vài lần một ngày - hai lần cho đến sáng nay) bị bắn phá với các bài đăng như:

Đơn vị bán bếp. Ba mươi Ex Hiển thị bếp để xóa. www. e x d i s p l a y k i t c h e n s 1 .co.uk £ 595 Mỗi thiết bị.

(URL hơi bị hỏng để không khuyến khích những người này.)

Rõ ràng đây là một công cụ gửi thư rác lớn hoạt động ở châu Âu (và diễn đàn của chúng tôi có khoảng 99% theo định hướng của Hoa Kỳ), vì vậy điều đó là vô nghĩa. Điều kỳ lạ nhất là việc spam liên tục dường như đã "đầu độc" URL cho Google (và có thể là các công cụ tìm kiếm khác) khiến bạn phải đánh vần khá nhiều URL để có được "cú đánh".

(Tất nhiên, điều kỳ lạ khác là các nhà khai thác hệ thống dường như không có khả năng chặn điều này, mặc dù URL luôn giống nhau.)

Một câu hỏi khác -

Vì, như tôi đã quan sát trước đó, các bài đăng "spam bếp" (cũng được thấy trên hàng chục BB khác) dường như đã "đầu độc" trang web liên quan cho Google, có thể là thư rác thực sự có ý định làm điều này và xúi giục bởi ai đó (một đối thủ cạnh tranh?), người muốn bị bệnh cho trang web đó?

65
Hot Licks

Họ đang cố gắng làm ngộ độc Bayes.

Bằng cách gửi nhiều từ chính xác và một vài từ được sử dụng trong thư rác, như viagra, những từ đó nhận được thông báo spam thấp hơn (theo thời gian).

Điều này có nghĩa là sau một thời gian họ có thể nhận được thư rác thực sự với các liên kết thông qua bộ lọc.

105
Lucas Kauffman

Quan sát của tôi là loại thư rác này là một vài bài đăng đầu tiên của người dùng mới được tạo. Sau một vài loại này, loại bình thường với các liên kết bao gồm bắt đầu.

Dự đoán của tôi về mục đích là:

  1. Đánh lừa phần mềm chống thư rác tập trung vào bài viết đầu tiên.
  2. Bắt mười bài đăng đầu tiên trên đường đi để họ có thể đăng liên kết. Một số phần mềm diễn đàn thực thi điều này.
  3. Công cụ tìm kiếm nhồi từ khóa. Tôi không thấy bất kỳ từ khóa rõ ràng nào trong mẫu của bạn nhưng tôi có trong các diễn đàn tôi điều hành.
28
Ladadadada

(Tuyên bố miễn trừ trách nhiệm: Tôi làm trong ngành chống thư rác nhưng tôi không chính thức đại diện cho chủ nhân của mình.)

Có hai loại thư rác trong câu hỏi này.

Hai ví dụ đầu tiên ("arugula" và "bình luận vẹt") là ngộ độc Bayes.

Nhiễm độc Bayes là một nỗ lực để che giấu nội dung thư rác giữa các nội dung ham, nhằm mục đích gây nhầm lẫn cho các bộ lọc thư rác học máy. Nó không thực sự hoạt động .

Ví dụ thứ ba ("đơn vị bếp") không có gì ngoài chủ đề (ví dụ: trích dẫn ngẫu nhiên như hai ví dụ đầu tiên) và khá ngắn gọn. Nhiễm độc Bayes được xác định bởi nội dung ngoài chủ đề hoặc không theo trình tự của nó và hầu như luôn luôn khá dài dòng, vì vậy đây không phải là ngộ độc Bayes.

Đơn vị bán bếp. Ba mươi Ex Hiển thị bếp để xóa. www. e x d i s p l a y k i t c h e n s 1 .co.uk £ 595 Mỗi thiết bị.

Đây là snowshoe spam, được đặt theo tên đôi giày giống như cái giỏ khổng lồ phân phối của bạn trọng lượng trên tuyết và do đó ngăn chặn chìm vào tuyết với mỗi bước. Điều này để lại một dấu chân nhẹ hơn và do đó khó theo dõi hơn. Snowshoe spam mong muốn bước đi tương tự nhẹ và khó nhận thấy hơn.

(URL hơi bị hỏng để không khuyến khích những người này.)

Sự cảnh báo đó thực sự quan trọng. Snowshoe có xu hướng không làm xáo trộn các liên kết của nó nhiều (vì điều đó làm cho nạn nhân ít có khả năng nhấp chuột hơn). Thay vào đó, tên miền được sử dụng ngắn gọn đến mức thư rác đã đến hộp thư đến của bạn vào thời điểm đó RI DNSBLs có thể đưa vào danh sách đen.

Snowshoe spam nói chung có một cơ thể ngắn, đang bán một cái gì đó, và giả vờ là một nhà tiếp thị có phần hợp pháp. Thế hệ của snowshoe hiện tại chỉ giới hạn ở các vật phẩm sạch về mặt đạo đức (như vòi bếp hoặc vòi làm vườn) thay vì các vật phẩm nghi vấn về đạo đức (như khiêu dâm hoặc ma túy), nhưng điều này có thể dễ dàng thay đổi.

Ban đầu, thư rác snowshoe có khối lượng rất thấp để tránh thông báo khỏi bẫy thư rác, nhưng những kẻ gửi thư rác đã học được rằng vì các bộ lọc nạp bẫy (như DNSBL) mất vài phút để truyền bá kiến ​​thức của họ, âm lượng rất cao sẽ hoạt động tốt nếu toàn bộ chiến dịch spam hoàn thành đầu tiên. Điều này phù hợp với nguyên tắc "bước đi nhẹ nhàng" có loại thư rác này được đặt tên mặc dù ngày nay nó ít được áp dụng.

12
Adam Katz

Bài đăng có thể xếp hạng tốt cho một từ khóa nhất định trong Google. Một vài ngày sau khi bài viết được viết, tác giả có thể thêm một liên kết đến chữ ký của tài khoản.

2
Christian