it-swarm-vi.com

Thêm nguồn cấp RSS / ATOM cho một trang web hoàn toàn tĩnh

Tôi đang giúp một người bạn để đưa một trang web rất lớn, hoàn toàn tĩnh ra khỏi thời kỳ đồ đá. Một điều tôi muốn thêm ngay lập tức là nguồn cấp dữ liệu RSS/ATOM.

Anh ấy không thích làm việc với bất kỳ loại CMS nào. Anh ta tạo các trang của mình bằng mẫu Dream Weaver, sau đó tải lên và cập nhật thủ công một số trang để liên kết đến nội dung mới. Trang web của anh ấy làm rất, rất tốt trong các công cụ tìm kiếm, nhưng anh ấy không hoàn toàn thu hút khách truy cập mới, những người có thể sẽ đưa anh ấy vào độc giả của họ.

Có thứ gì tôi có thể cài đặt cho phép anh ta dễ dàng/tự thêm các mục mới vào nguồn cấp dữ liệu không? Có lẽ một cái gì đó nếu được cung cấp một liên kết có thể lấy một đoạn trích nội dung?

Tìm kiếm xung quanh mang lại hàng trăm thứ có thể hoạt động, nhưng nhiều thứ từ năm 2000 hoặc trước đó chưa được cập nhật. Ngôn ngữ không quan trọng, nhưng PHP/Python sẽ là lý tưởng.

Tôi thực sự cần một cái gì đó tự lưu trữ.

Chỉnh sửa

Luồng này phải là, quản trị trang web tạo một trang tĩnh mới, tải nó lên, liên kết đến nó .. bây giờ một số đề cập đến trang đó sẽ tồn tại trong nguồn cấp RSS. Lý tưởng nhất, quản trị trang web chỉ có thể cung cấp liên kết đến trang mới và tiêu đề với một đoạn trích ngắn sẽ xuất hiện trong nguồn cấp dữ liệu.

Chỉnh sửa

Có lẽ ngay cả một cái gì đó vừa loại bỏ tiêu đề/đoạn trích từ các thẻ nhận xét, tức là:

<!-- BEGIN EXCERPT
<p>The quick brown fox got p0wned by l33t kittens</p>
-->

Tôi không cần một trình phân tích cú pháp đầy đủ, chỉ cần một cái gì đó giúp người có kỹ năng tối thiểu dễ dàng duy trì nguồn cấp dữ liệu trên một trang web hoàn toàn tĩnh.

3
Tim Post

Dan Bricklin, người tạo ra VisiCalc, có một sản phẩm miễn phí có tên Software Garden ListGarden tạo nguồn cấp RSS theo cách thủ công:

alt text
(nguồn: softwaregarden.com )

7
Joel Spolsky

Tôi không thể nghĩ ra bất cứ điều gì ngoài giá, nhưng bạn có thể dễ dàng viết kịch bản tương tự như thế này trong Ruby chẳng hạn.

Nokogiri là trình phân tích cú pháp XML và HTML rất phổ biến mà bạn nên sử dụng để đọc trang được cung cấp liên kết mà quản trị viên web cung cấp. Sau đó, bạn có thể trích xuất văn bản trích dẫn và tiêu đề. Bạn có thể đọc trong XML nguồn cấp dữ liệu hiện tại của mình, thêm thông tin mới và viết lại.

3
danivovich

Trước khi tìm một giải pháp dứt khoát (tôi không có nó), bạn luôn có thể thử và sử dụng Google cho việc này.

Ví dụ. Đăng nhập vào Google Reader, nhấp vào nút Thêm, thêm trang web của bạn bè của bạn ở đó, Google sẽ cho bạn biết rằng nó không có nguồn cấp dữ liệu và hỏi bạn có muốn Google xem trang và tạo một trang cho bạn không. Sau đó nhìn vào "URL nguồn cấp dữ liệu" ở đó (http://www.google.com/notifyingervice/webchanges/webfeed/LONGNUMBER) và nhờ bạn bè của bạn nhúng nó vào trang chủ của anh ấy, làm URL nguồn cấp dữ liệu của anh ấy.

1
intlect

Sẽ không quá khó để viết một tập lệnh PHP/Python tự động tạo nguồn cấp RSS. Quá trình sẽ là:

  • Tìm kiếm hệ thống tệp cho các tệp mới nhất (ví dụ: lấy mọi tệp có phần mở rộng .html, lưu trữ trong một mảng có ngày, sau đó sắp xếp chúng theo ngày).
  • Sử dụng trình phân tích cú pháp HTML để trích xuất thông tin từ các tệp đó (ví dụ: thẻ tiêu đề, đoạn đầu tiên trong một yếu tố cụ thể).
  • Viết dữ liệu sang định dạng RSS XML.

Bạn sẽ có thể tìm thấy một vài tập lệnh (như trình phân tích cú pháp HTML) để giúp bạn trên đường. Nếu không, hãy hỏi Stack Overflow để được giúp đỡ :)

1
DisgruntledGoat

Nhìn thấy anh ấy làm mọi thứ bằng tay, tại sao không cũng làm bằng tay ? ...

0
intlect

Có một mẹo bookmarklet Nice "Ghi chú trong Reader" bạn có thể sử dụng để tạo nguồn cấp RSS tùy chỉnh

0
mvark