fragen stichworte

Einfache Open-Source-Lösung zum Speichern und Speichern von PDF-Dokumenten

Ich bin an einer sehr kleinen Wohnungsverwaltungsgesellschaft beteiligt, die über viele Dokumente verfügt, die ich als PDF-Dokument digitalisieren und im Internet für alle Anwohner zugänglich machen möchte. Viele Leute sind nicht technisch, daher ist etwas Einfacheres zu verwenden.

Ich habe die Fähigkeit, eine serverbasierte LAMP-basierte Lösung einzurichten, die jedoch beim Kauf oder der Wartung keine nennenswerten Kosten verursachen sollte, also Open Source, vorzugsweise mit geringem Speicherbedarf. Alles, was ich bisher angeschaut habe (wie Alfresco, KnowledgeTree und LogicalDOC), wirkt wie ein Overkill und sowohl in Bezug auf das Setup als auch für die Benutzer komplex.

Ich dachte so etwas wie AjaxExplorer nach, der scheinbar das Durchsuchen von Dateien zu einem Teil dessen macht, was ich bewundernswert machen möchte. Gibt es in Bezug auf die Volltextsuche ein Produkt, das mit AjaxExplorer funktioniert, oder etwas anderes, das daneben funktionieren kann, das die Leute als relativ einfach zu konfigurierendes Werkzeug für die Indexierung und anschließende Suche in einem Dokumentenrepository empfehlen würden?

Es ist akzeptabel, separate Bereiche des Frontends für das Durchsuchen des Dateibaums sowie die einfache Suche nach Dateinamen/Metadaten und Volltextsuche zu verwenden, wenn, wie ich vermute, keine geeignete integrierte Lösung vorhanden ist.

antworten

Ich habe MNOGOsearch zum Indizieren eines Stapels von PDF-Dateien verwendet. Es führt Volltextsuchen in PDFs und vielen anderen Dokumenttypen durch. Das Such-Frontend kann Ihnen auch bekannt vorkommen.

Die * nix-Versionen sind von GNU lizenziert.

http://www.mnogosearch.org/

ownCloud ist eine Open-Source-Lösung zum Speichern von Dateien, die auf LAMP ausgeführt werden können. Es hat eine sehr saubere Schnittstelle, und obwohl es andere Funktionen (Kalender, Kontakte, Musik, Bilder) hat, können Sie alle leicht deaktivieren. Ab Version 3 ist ein PDF-Viewer integriert. Ab Version 5 wird die Volltextsuche in PDF von Lucene unterstützt.

Ich persönlich würde einfach eine reguläre Distribution von Apache (ohne PHP) verwenden und dann einen Filter hinzufügen, der nur die .pdf-Dokumente bedient:

Es gibt viele verschiedene Möglichkeiten, dies zu tun. Diese Anweisung, die Sie beispielsweise in Ihrem "Directory" -Knoten in Ihrer httpd.conf-Datei platzieren:

<Directory "C:/Apache2.2/htdocs">
    Options Indexes Includes MultiViews
    IndexOptions +ScanHTMLTitles -IconsAreLinks FancyIndexing FoldersFirst NameWidth=*
    AddIcon (IMG,/webicons/image3.gif) .gif .png .jpeg .jpg .xbm .PNG .JPG .GIF .tiff .bmp
    AddIcon (IMG,/webicons/compressed.gif) .7z .zip .cab .tar .jar .mdb .ldf .mdf .CAB
    AddIcon (IMG,/webicons/binary.gif) .exe .msi .rdp .pcf .dia .class .ks .keystore .scc
    AddIcon (IMG,/webicons/a.gif) .txt .log .properties .doc .xls .xml .ts .msg .dat .sql .csv .pem .sh .py .tlp .java .der .csr .key .crt .bat .cmd .inf
    AddIcon (IMG,/webicons/link.gif) .lnk .htm .url .URL
    AddIcon (IMG,/webicons/pdf.gif) .pdf
    AddIcon/webicons/folder.png ^^DIRECTORY^^
    #ForceType application/octet-stream
    ....
    ....

Geben Sie dann Folgendes ein: http://domain.com/pdf/blah.pdf

Wenn Sie wirklich eine Suchfunktion benötigen, können Sie PHP installieren und die PHP-Einfachdatei-Suche verwenden.