XF2.2 Zwei Fragen: in der PDF Suchen und RM Dateien ablage

Dieses Thema im Forum "Fragen und Antworten" wurde erstellt von Delazar, 26. Apr. 2021.

  1. Delazar

    Delazar Bekanntes Mitglied Lizenzinhaber

    Hallo Leute,

    habe zwei Fragen.
    1. Ist es möglich per Add-on bei der Suche den Inhalt einer PDF mitzusuchen zu lassen (Forum und RM)?
    2. Wo werden die Dateien von RM abgelegt?

    Danke
    Delazar
     
  2. Hoffi

    Hoffi !important Lizenzinhaber

    1) Uh, ich kenne keins.
    2) Im Internal-Data Folder, wie alle Attachments.

    Edit:
    2) Genauer:
    Die Attachments selber im Internal-data Bereich.
    Die Thumbnails im data Ordner.
     
  3. Delazar

    Delazar Bekanntes Mitglied Lizenzinhaber

    Zu 1. ist es schwer so etwas zu programmieren?
    Zu 2. werden die Dateien verschlüsselt oder werden die klar abgelegt?
     
  4. Hoffi

    Hoffi !important Lizenzinhaber

    It depends. ;)
    Die erste Hürde ist das PDF lesen mit PHP. Es gibt zwar ein paar Libaries, aber die sind entweder a) teuer oder b) nicht wirklich stabil was die Weiterentwicklung angeht. Aktuell würde ich zu Xpdf tendieren, das lässt auch mittels Composer inkludieren.
    Dazu kommt dann natürlich die Problematik, das das PDF gut sein muss. Das bedeutet: Kein Bild, sondern Text. Getrennte Wörter auch als solche gekennzeichnet, und nicht als zwei Wörter im PDF, uvm.
    Dann muss man sich Gedanken machen, wie man das Suchergebnis anzeigt, wenn der Hit aus einem PDF kommt. Im XF Suchergebnis wird ja KiC angezeigt, also Keyword in Context.

    Der Sinnvollste Ansatz aus dem Ärmel wäre es, beim hochladen des PDF dies einmal komplett zu lesen und in eine separate Tabelle zu schreiben, welche man in den Index mit aufnimmt, um dann auch aus dem Bereich den Kontext lädt.

    Trivial ist es nicht, machnbar ist es. Aber es wird immer eine Grauzone geben.

    Da wird nichts verschlüsselt. Aber es ist der Internal-Data Folder, da kommt man (bei richtiger Server Konfiguration) nicht öffentlich dran.
     
    otto gefällt das.
  5. Delazar

    Delazar Bekanntes Mitglied Lizenzinhaber

    @Hoffi : Danke für die Antworten
    Es geht um Intern bei der Firma. Also kein Public und auch keine Grauzone ;)
     
  6. toffee

    toffee Bekanntes Mitglied Lizenzinhaber

    Ist schon bissel veraltet, gibt welche die aktuell noch gepflegt werden. Daher sinniger bei Problemen.

    Aber was spricht gegen pdftotext? Commandline Tool... Man exportiert den Text, speichert den in einer Tabelle der Rest deiner Idee ist gut
     
  7. Hoffi

    Hoffi !important Lizenzinhaber

    War nur eine kurze Recherche. Welches Tool müsste man dann genauer analysieren.

    Ich würde auf keinen Fall ein Commandline Tool nutzen Viele PHP Installationen verbieten oft exec, denn das ist ein Sicherheitsrisiko.
    Auch wenn XF exec als Empfolene Einstellung vorschlägt, würde ich das nicht benutzen.
     
  8. McAtze

    McAtze Innendienst Lizenzinhaber

    @Hoffi die Image Optimizer AddOns bei XF.com sind beide mit exec gelöst. Gäbe es da Alternativen?
     
  9. Hoffi

    Hoffi !important Lizenzinhaber

    Hab ich mich bisher nicht mit beschäftigt. Vermutlich ist das iMagick, das läuft (zumindest als ich mich das letzte mal mit Beschäftigt habe) auch über exec.
     
  1. Diese Seite verwendet Cookies, um Inhalte zu personalisieren, diese deiner Erfahrung anzupassen und dich nach der Registrierung angemeldet zu halten.
    Wenn du dich weiterhin auf dieser Seite aufhältst, akzeptierst du unseren Einsatz von Cookies.
    Information ausblenden