|

Light Image Resizer 7.2.1 × Ollama supporta AI Vision

L'editor di immagini leggero AI Vision è stato aggiornato per supportare Ollama. Ora puoi scegliere tra utilizzare una soluzione cloud come ChatGPT o Google Gemini API, oppure eseguire uno dei modelli di visione LLM localmente usando Ollama.

Cos'è AI Vision?

AI Vision è la funzionalità che descrive un'immagine e la converte in testo.
Puoi usarlo su foto o screenshot, ad esempio, per:

  • Estrarre parole chiave e migliorare i risultati di ricerca locali
  • Aggiungere descrizioni delle immagini ai metadati
  • Rilevare contenuti specifici (ad esempio, immagini in cui le persone sorridono)
  • Combinare descrizione e analisi
  • Eseguire estrazioni di base simili all'OCR

Vedi campioni e maggiori dettagli su AI VISION in questa pagina prodotto :
https://www.obviousidea.com/ai-vision-describe-image-to-prompt/

Cos'è Ollama AI Vision?

Ollama is a program to run LLM models locally on your computer.
You can download models for free from the Ollama website and run them without an internet connection.

AI Vision in Light Image Editor

Light Image Editor is included in the package of Light Image Resizer. It is a Windows application to process single images—editing, upscaling, and now AI Vision.

With this feature, you can:

  • Add text descriptions directly into image metadata
  • Use custom prompts for analysis or keyword generation
  • Review previous prompts with the history button
  • Adapt the output depending on the image content and prompt

Why Is Ollama Support Important?

Compared to cloud APIs like ChatGPT or Google Gemini, Ollama offers two key advantages:

1. No API costs

Eseguire il modello sulla propria macchina significa nessun credito API o limiti di utilizzo. Puoi analizzare tutte le immagini che desideri. Sarà completamente gratuito poiché è un progetto open source.

2. Privacy

Tutto rimane locale: non c'è bisogno di caricare foto o documenti privati. Ollama funziona offline, o tramite VPN o Cloudflare Tunnel per accesso remoto all'interno della tua rete.

Limitazioni di Ollama per la Visione AI

Anche se siamo qui per aiutare, utilizzare Ollama richiede alcuni passaggi extra:

  • Installa il software Ollama (facile)
  • Esegui un comando da terminale per scaricare un modello di visione (vedi l'elenco qui)
  • Richiede competenze tecniche di base (ma possiamo assisterti)

Eseguire modelli di visione avanzati richiede anche hardware potente:

  • Minimo 16 GB di RAM
  • È altamente raccomandata una GPU dedicata.
  • Abbiamo testato Ollama con NVIDIA 4060 Super e 3090 (24 GB VRAM)

Possiamo fornire consulenza o aiuto remoto (Zoom, Google Meet o Windows Quick Assist).

Quali sono i migliori modelli da utilizzare con Ollama?

La scelta del modello dipende dall'hardware, dalla lingua e dal caso d'uso.

Ecco alcuni che raccomandiamo:

  • Gemma 4B – Veloce e buon supporto linguistico
  • Mistral 3.1 – Più lento ma preciso
  • Qwen2.5-VL – Nuovo, promettente, da testare

Alcuni modelli funzionano principalmente in inglese, mentre altri possono supportare correttamente il francese, il tedesco o lo spagnolo.

Guarda il dialogo in Light Image Editor per scegliere il tuo modello:

Seleziona il tuo modello Ollama nelle impostazioni. Gemma, MiniCPM, LLava, Qwen, Granite

Quali sono i prossimi passi con Ollama e AI Vision?

Currently, AI Vision can run automatically when an image is opened in Light Image Editor.
It’s not a batch tool yet, but integration into Light Image Resizer may come based on user feedback.

This feature is also part of our #legaltechsoftware catalog of solutions, with use cases for:

  • Lawyers
  • Real estate professionals
  • Photographers

If you are a Photographer using Lightroom, we also recommend the project LR AI Assistant, specialized in adding keywords and descriptions to your Adobe Lightroom catalog.

Let us know if you want this feature to go further! As Obviousidea will integrate it in the Light Image Resizer batch part only if we have expressions of interest from our users.