|

Light Image Resizer 7.2.1 × Ollama Support für AI Vision

Light Image Editor AI Vision wurde aktualisiert, um Ollama zu unterstützen. Sie können jetzt wählen, ob Sie eine Cloud-Lösung wie ChatGPT oder Google Gemini API verwenden oder eines der LLM-Vision-Modelle lokal mit Ollama ausführen möchten.

Was ist AI-Vision?

AI Vision ist eine Funktion, die ein Bild beschreibt und in Text umwandelt.
Sie können es beispielsweise für folgende Anwendungsfälle auf Fotos oder Screenshots anwenden:

  • Extrahieren von Schlüsselwörtern und Verbessern von lokalen Suchergebnissen
  • Hinzufügen von Bildbeschreibungen zu Metadaten
  • Erkennen bestimmter Inhalte (z. B. Bilder, auf denen Menschen lächeln)
  • Kombinieren von Beschreibung und Analyse
  • Durchführen grundlegender OCR-ähnlicher Extraktion

Was ist Ollama AI Vision?

Ollama ist ein Programm zum lokalen Ausführen von LLM-Modellen auf Ihrem Computer.
Sie können Modelle kostenlos herunterladen von der Ollama-Website und sie ohne Internetverbindung ausführen.

AI Vision im Light Image Editor

Light Image Editor ist im Paket von Light Image Resizer. Es handelt sich um eine Windows-Anwendung zur Verarbeitung einzelner Bilder – Bearbeiten, Hochskalieren und jetzt AI-Vision.

Mit dieser Funktion können Sie:

  • Textbeschreibungen direkt in die Bildmetadaten einfügen
  • Benutzerdefinierte Prompts für Analyse oder Schlüsselwörter-Generierung verwenden
  • Überprüfen vorheriger Prompts mit der Schaltfläche "Verlauf"
  • Ausgabe je nach Bildinhalt und Prompt anpassen

Warum ist Ollama Support wichtig?

Im Vergleich zu Cloud-APIs wie ChatGPT oder Google Gemini bietet Ollama zwei entscheidende Vorteile:

1. Keine API-Kosten

Wenn Sie das Modell auf Ihrem eigenen Computer ausführen, gibt es keine API-Credits oder Nutzungsbeschränkungen. Sie können so viele Bilder analysieren, wie Sie möchten. Es wird völlig kostenlos sein, da es sich um ein Open-Source-Projekt handelt.

2. Datenschutz

Alles bleibt lokal – Sie müssen keine privaten Fotos oder Dokumente hochladen. Ollama funktioniert offline oder über ein VPN oder Cloudflare Tunnel für den Fernzugriff innerhalb Ihres Netzwerks.

Einschränkungen von Ollama für AI Vision

Auch wenn wir hier sind, um Ihnen zu helfen, erfordert die Verwendung von Ollama einige zusätzliche Schritte:

  • Installieren Sie die Ollama-Software (einfach)
  • Führen Sie eine Befehlszeile aus, um ein Vision-Modell herunterzuladen (siehe Liste hier)
  • Erfordert grundlegende technische Fähigkeiten (aber wir können Ihnen helfen)

Für den Betrieb fortschrittlicher Vision-Modelle ist auch leistungsstarke Hardware erforderlich:

  • Mindestens 16 GB RAM
  • Eine dedizierte GPU wird dringend empfohlen
  • Wir haben Ollama mit NVIDIA 4060 Super und 3090 (24 GB VRAM) getestet

Wir können Beratung oder Fernunterstützung anbieten (Zoom, Google Meet oder Windows Remotehilfe).

Was sind die besten Modelle, die man mit Ollama verwenden kann?

Die Wahl des Modells hängt von Ihrer Hardware, Ihrer Sprache und Ihrem Anwendungsfall ab.

Hier sind einige, die wir empfehlen:

  • Gemma 4B – Schnelle und gute Sprachunterstützung
  • Mistral 3.1 – Langsamer, aber genau
  • Qwen2.5-VL – Neu, vielversprechend, es lohnt sich, es zu testen

Einige Modelle funktionieren hauptsächlich auf Englisch, während andere auch Französisch, Deutsch oder Spanisch korrekt unterstützen.

Hier sehen Sie das Dialogfeld in Light Image Editor, um Ihr Modell auszuwählen:

Wählen Sie Ihr Ollama-Modell in den Einstellungen aus. Gemma , MiniCPM, LLava, Qwen, Granit

Wie geht es weiter mit Ollama und AI Vision?

Derzeit kann AI Vision automatisch ausgeführt werden, wenn ein Bild in Light Image Editor geöffnet wird.
Es ist noch kein Batch-Tool, aber die Integration in Light Image Resizer könnte auf der Grundlage von Benutzerfeedback erfolgen.

Diese Funktion ist auch Teil unserer #legaltechsoftware Lösungen mit Anwendungsfällen für:

  • Anwälte
  • Immobilienprofis
  • Fotografen

Wenn Sie als Fotograf Lightroom verwenden, empfehlen wir Ihnen auch das Projekt LR AI Assistant, das auf das Hinzufügen von Schlüsselwörtern und Beschreibungen zu Ihrem Adobe Lightroom-Katalog spezialisiert ist.

Lassen Sie uns wissen, wenn Sie möchten, dass diese Funktion weiterentwickelt wird! Da Obviousidea es nur dann in den Light Image Resizer-Batch-Teil integrieren wird, wenn wir Interessensbekundungen von unseren Nutzern haben.