|

Light Image Resizer 7.2.1 × Ollama supporta AI Vision

L'editor di immagini leggero AI Vision è stato aggiornato per supportare Ollama. Ora puoi scegliere tra utilizzare una soluzione cloud come ChatGPT o Google Gemini API, oppure eseguire uno dei modelli di visione LLM localmente usando Ollama.

Cos'è AI Vision?

AI Vision è la funzionalità che descrive un'immagine e la converte in testo.
Puoi usarlo su foto o screenshot, ad esempio, per:

  • Estrarre parole chiave e migliorare i risultati di ricerca locali
  • Aggiungere descrizioni delle immagini ai metadati
  • Rilevare contenuti specifici (ad esempio, immagini in cui le persone sorridono)
  • Combinare descrizione e analisi
  • Eseguire estrazioni di base simili all'OCR

Vedi campioni e maggiori dettagli su AI VISION in questa pagina prodotto :
https://www.obviousidea.com/ai-vision-describe-image-to-prompt/

Cos'è Ollama AI Vision?

Ollama è un programma per eseguire modelli LLM localmente sul tuo computer.
Puoi scaricare modelli gratuitamente dal sito web di Ollama ed eseguirli senza connessione a internet.

AI Vision in Light Image Editor

Light Image Editor è incluso nel pacchetto di Light Image Resizer. È un'applicazione per Windows per elaborare singole immagini—modifica, ingrandimento e ora AI Vision.

Con questa funzione, puoi:

  • Aggiungere descrizioni testuali direttamente nei metadati delle immagini
  • Usare prompt personalizzati per l'analisi o la generazione di parole chiave
  • Rivedere i prompt precedenti con il pulsante cronologia
  • Adattare il risultato in base al contenuto dell'immagine e al prompt

Perché il supporto per Ollama è importante?

Rispetto alle API cloud come ChatGPT o Google Gemini, Ollama offre due vantaggi chiave:

1. Nessun costo API

Eseguire il modello sulla propria macchina significa nessun credito API o limiti di utilizzo. Puoi analizzare tutte le immagini che desideri. Sarà completamente gratuito poiché è un progetto open source.

2. Privacy

Tutto rimane locale: non c'è bisogno di caricare foto o documenti privati. Ollama funziona offline, o tramite VPN o Cloudflare Tunnel per accesso remoto all'interno della tua rete.

Limitazioni di Ollama per la Visione AI

Anche se siamo qui per aiutare, utilizzare Ollama richiede alcuni passaggi extra:

  • Installa il software Ollama (facile)
  • Esegui un comando da terminale per scaricare un modello di visione (vedi l'elenco qui)
  • Richiede competenze tecniche di base (ma possiamo assisterti)

Eseguire modelli di visione avanzati richiede anche hardware potente:

  • Minimo 16 GB di RAM
  • È altamente raccomandata una GPU dedicata.
  • Abbiamo testato Ollama con NVIDIA 4060 Super e 3090 (24 GB VRAM)

Possiamo fornire consulenza o aiuto remoto (Zoom, Google Meet o Windows Quick Assist).

Quali sono i migliori modelli da utilizzare con Ollama?

La scelta del modello dipende dall'hardware, dalla lingua e dal caso d'uso.

Ecco alcuni che raccomandiamo:

  • Gemma 4B – Veloce e buon supporto linguistico
  • Mistral 3.1 – Più lento ma preciso
  • Qwen2.5-VL – Nuovo, promettente, da testare

Alcuni modelli funzionano principalmente in inglese, mentre altri possono supportare correttamente il francese, il tedesco o lo spagnolo.

Guarda il dialogo in Light Image Editor per scegliere il tuo modello:

Seleziona il tuo modello Ollama nelle impostazioni. Gemma, MiniCPM, LLava, Qwen, Granite

Quali sono i prossimi passi con Ollama e AI Vision?

Attualmente, AI Vision può funzionare automaticamente quando un'immagine viene aperta in Light Image Editor.
Non è ancora uno strumento batch, ma l'integrazione in Light Image Resizer potrebbe arrivare in base ai feedback degli utenti.

Questa funzionalità fa anche parte del nostro #legaltechsoftware catalogo di soluzioni, con casi d'uso per:

  • Avvocati
  • Professionisti del settore immobiliare
  • Fotografi

Se sei un fotografo che utilizza Lightroom, ti consigliamo anche il progetto LR AI Assistant, specializzato nell'aggiungere parole chiave e descrizioni al tuo catalogo Adobe Lightroom.

Facci sapere se desideri che questa funzione venga ulteriormente sviluppata! Obviousidea la integrerà nella parte batch di Light Image Resizer solo se riceviamo manifestazioni di interesse dai nostri utenti.