it-swarm-vi.com

Công cụ tìm kiếm tự lưu trữ lý tưởng là gì?

Tôi có một trang web nội bộ (mạng nội bộ) bao gồm một số blog và diễn đàn, hàng trăm trang tĩnh, rất nhiều tệp PDF và một số loại tài liệu khác. Nó đã được dán lại một cách lỏng lẻo trong vài năm qua và bây giờ công việc của tôi là duy trì nó.

Tôi đang tìm kiếm một công cụ tìm kiếm mà tôi có thể lưu trữ bản thân một cách lý tưởng:

  1. Cho phép tìm kiếm trực tiếp cơ sở dữ liệu Blog/Diễn đàn nếu được cung cấp thông tin và bảng cơ sở dữ liệu để tìm kiếm.

  2. Xử lý hầu hết các tài liệu văn bản (PDF/DOC/ODF)

  3. Là nguồn mở hoặc cho phép truy cập vào mã nguồn sau khi mua

Nó không quan trọng đối với tôi ngôn ngữ hoặc nền tảng được viết bằng gì. Thông thường, tôi chỉ sử dụng tìm kiếm trang web của Google, nhưng đó không phải là một tùy chọn cho mạng nội bộ.

11
Tim Post

Kiểm tra Lucene

Được viết bằng Java cũng có sẵn cho . NET framework

Đây là một bài viết CodeProject giải thích cách thức hoạt động và cách sử dụng. http://www.codeproject.com/KB/l Library/IntellingingLucene.aspx

7
jessegavin

Tôi đã sử dụng Sphider trước đây và đã rất ấn tượng.

2
Darryl Hein

SearchBlox dựa trên Lucene có thể đáp ứng nhu cầu của bạn. Nó là miễn phí và đi kèm với một trình thu thập thông tin.

2
user5213

Thông thường, tôi chỉ sử dụng tìm kiếm trang web của Google, nhưng đó không phải là một tùy chọn cho mạng nội bộ.

Thực tế, có công cụ tìm kiếm Google tương đương với tìm kiếm trang web của Google cho mạng nội bộ. Tuy nhiên, đây không phải là nguồn mở (dù vậy, tìm kiếm trang web google cũng không phải trong trường hợp bạn không nhận thấy.)

0
delete