XF2.2 Zwei Fragen: in der PDF Suchen und RM Dateien ablage

Delazar

Bekanntes Mitglied
Lizenzinhaber
Registriert
18. Jan. 2011
Beiträge
702
Punkte
108
XF Version
  1. 1.5.2
PHP-Version
5.4.45
MySQL/MariaDB
5.5.46
Provider/Hoster
Privater
Hallo Leute,

habe zwei Fragen.
  1. Ist es möglich per Add-on bei der Suche den Inhalt einer PDF mitzusuchen zu lassen (Forum und RM)?
  2. Wo werden die Dateien von RM abgelegt?

Danke
Delazar
 
1) Uh, ich kenne keins.
2) Im Internal-Data Folder, wie alle Attachments.

Edit:
2) Genauer:
Die Attachments selber im Internal-data Bereich.
Die Thumbnails im data Ordner.
 
Zu 1. ist es schwer so etwas zu programmieren?
Zu 2. werden die Dateien verschlüsselt oder werden die klar abgelegt?
 
ist es schwer so etwas zu programmieren?
It depends. ;)
Die erste Hürde ist das PDF lesen mit PHP. Es gibt zwar ein paar Libaries, aber die sind entweder a) teuer oder b) nicht wirklich stabil was die Weiterentwicklung angeht. Aktuell würde ich zu Xpdf tendieren, das lässt auch mittels Composer inkludieren.
Dazu kommt dann natürlich die Problematik, das das PDF gut sein muss. Das bedeutet: Kein Bild, sondern Text. Getrennte Wörter auch als solche gekennzeichnet, und nicht als zwei Wörter im PDF, uvm.
Dann muss man sich Gedanken machen, wie man das Suchergebnis anzeigt, wenn der Hit aus einem PDF kommt. Im XF Suchergebnis wird ja KiC angezeigt, also Keyword in Context.

Der Sinnvollste Ansatz aus dem Ärmel wäre es, beim hochladen des PDF dies einmal komplett zu lesen und in eine separate Tabelle zu schreiben, welche man in den Index mit aufnimmt, um dann auch aus dem Bereich den Kontext lädt.

Trivial ist es nicht, machnbar ist es. Aber es wird immer eine Grauzone geben.

werden die Dateien verschlüsselt oder werden die klar abgelegt?
Da wird nichts verschlüsselt. Aber es ist der Internal-Data Folder, da kommt man (bei richtiger Server Konfiguration) nicht öffentlich dran.
 
@Hoffi : Danke für die Antworten
Es geht um Intern bei der Firma. Also kein Public und auch keine Grauzone ;)
 
Ist schon bissel veraltet, gibt welche die aktuell noch gepflegt werden. Daher sinniger bei Problemen.

Aber was spricht gegen pdftotext? Commandline Tool... Man exportiert den Text, speichert den in einer Tabelle der Rest deiner Idee ist gut
 
War nur eine kurze Recherche. Welches Tool müsste man dann genauer analysieren.

Ich würde auf keinen Fall ein Commandline Tool nutzen Viele PHP Installationen verbieten oft exec, denn das ist ein Sicherheitsrisiko.
Auch wenn XF exec als Empfolene Einstellung vorschlägt, würde ich das nicht benutzen.
 
@Hoffi die Image Optimizer AddOns bei XF.com sind beide mit exec gelöst. Gäbe es da Alternativen?
 
@Hoffi die Image Optimizer AddOns bei XF.com sind beide mit exec gelöst. Gäbe es da Alternativen?
Hab ich mich bisher nicht mit beschäftigt. Vermutlich ist das iMagick, das läuft (zumindest als ich mich das letzte mal mit Beschäftigt habe) auch über exec.
 
Zurück
Oben