Funzione di visione AI – Descrivi immagine al prompt
AI Vision is the feature to describe an image and convert the image to a prompt. It’s done by using one of the popular IA models such as ChatGPT or Gemini. You can select the model you prefer, based on the performance or the cost.

Perché descrivere le tue foto?
Trovare le parole giuste per le tue foto è facile con Light Image Resizer Funzione AI Vision Nell'editor di immagini Light. Analizza le tue immagini a livello tecnico per generare automaticamente le descrizioni. L'applicazione prepara la tua immagine (convertendola in JPEG e ridimensionandola a una dimensione come 1024×1024, regolabile) per un'efficiente elaborazione AI. Questa fase di pre-analisi consente di garantire un'elaborazione più rapida e di rendere la funzionalità più conveniente. Lascia che sia l'IA a descrivere, così non devi farlo tu!

Scarica l'editor di immagini Light Image Editor
Scarica e installa Ridimensionatore di immagini luminose 7
Individua Light Image Editor nell'icona nella barra delle applicazioni, carica un'immagine ed esegui nel menu principale – Utensileria – Visione AI.
Ottieni la chiave API
La funzione AI Vision con intelligenza artificiale è ora disponibile nell'applicazione Light Image Editor. Che è un pacchetto con il pacchetto di installazione di Light Image Resizer. È un'app locale solo per Windows. Avrai bisogno di una chiave API , per Google Gemini o ChatGPT di OpenAI. Ciò significa che pagherai in base al consumo, senza bisogno di un abbonamento mensile.
Innanzitutto, ottieni la chiave API dei modelli di visione
Ottieni la chiave API per Google AI Studio (Gemini)
Ottieni la chiave API da OpenAI (ChatGPT)
Per ora, consigliamo di utilizzare Gemini, più economico e funziona bene per descrivere le immagini.
Una volta ottenuta la chiave (e i crediti), è possibile inserire la chiave nell'opzione Light Image Resizer AI vision disponibile in questo menu.
I modelli di visione LLM funzionano bene in inglese, francese, tedesco e nelle lingue più diffuse, il che non è il caso di altri modelli di visione popolari, Ollama potrebbe essere supportato in seguito se lo trovi interessante e il grande vantaggio significa che i dati saranno completamente privati e locali e non ti verrà addebitato alcun costo per richieste e token. Scopri i modelli di visione supportati da Ollama
Disclaimer: To be fully 100% Local and private, you need to use Ollama and a Local Model, for ChatGPT and Gemini the app resizes and sends the image to the cloud but don’t store any copy, if you don’t want to share your pictures or sensitive data (especially NSFW content) don’t use the cloud models but Ollama.
Che tipo di attività puoi completare?
Annota le tue immagini per trovarle per parole chiave. Geoindovinare la foto quando non ricordi dove l'hai scattata. Trova ispirazione quando vuoi pubblicare un nuovo post su Instagram o TikTok. Aggiungerà alcune belle icone per migliorare il tuo marketing.
Tutto dipende dal tuo prompt, guarda alcuni esempi di prompt e come influisce sul risultato.
Una volta ottenuta la chiave (e i crediti), è possibile inserire la chiave nell'opzione Light Image Resizer AI vision disponibile in questo menu.
I modelli di visione LLM funzionano bene in inglese, francese, tedesco e nelle lingue più diffuse, cosa che non è il caso di altri modelli di visione popolari. Ollama potrebbe essere supportato in un secondo momento se lo trovi interessante e il grande vantaggio è che i dati saranno completamente privati e locali e non ti verrà addebitato alcun costo per richieste e token. Scopri i modelli di visione supportati da Ollama
Qual è la differenza tra descrivere un'immagine, analizzare un'immagine, riassumere un'immagine?
E potrebbe essere la stessa domanda sulla differenza tra un'immagine, una fotografia e un quadro. È un po' la stessa cosa, ma dipende da cosa devi fare e da chi sei. Vedi alcune attività di AI Vision possibili:
- Trovare parole chiave per i fotografi
- OCR e documento riepilogativo per i contabili
- Didascalia automatica delle immagini
- Influenza l'ispirazione per i post di Instagram o Tiktok
- Identifica marchi e celebrità
- E-commerce di moda
- Ipotesi geografiche – Trova la posizione dalla foto
- Diagnostica scientifica, sanitaria, astronomica
Alcune ispirazioni di suggerimenti per descrivere un'immagine
Parole chiave per la fotografia
Restituisci direttamente senza commento un elenco di 50 parole chiave separate da una virgola per descrivere l'argomento, lo sfondo, gli oggetti, la posizione e l'umore
donna, decappottabile, auto, deserto, cammelli, sabbia, strada, viaggio, turismo, avventura, vacanza, elegante, moda, ritratto, all'aperto, soleggiato, vento, capelli, capelli rossi, sciarpa, auto bianca, sedili in pelle, poggiatesta, paesaggio asciutto, arido, calore, luce del sole, modello, in posa, fiducioso, rilassato, attrazione turistica, orizzonte, sfondo, lontano, sfocato, fuori fuoco, trasporto, aperto, tempo libero, voglia di viaggiare, moderno, alla moda, vogue, elegante, eleganza, libertà, viaggio, esploratore, remoto, panoramico, destinazione, casuale, estate, giorno, vacanza, fuga, avventura, viaggio, viaggio su strada.
Riepilogo del documento OCR
Esegui un OCR dettagliato del documento, quindi traduci in inglese e spiega in un riassunto di 200 parole qual è il documento e gli elementi importanti.
Questo documento è una fattura da “Les Minotiers,” un hotel/alloggio (Logis de France) situato a Mirepoix, Francia. La fattura, numerata 43197 e datata 18 febbraio 2014, riporta in dettaglio le spese per un soggiorno nella camera 12. L'ospite è arrivato il 17 febbraio 2014 ed è ripartito il 18 febbraio 2014. L'importo totale dovuto è di 73,92 euro. Le tariffe comprendono il prezzo della camera (57,00 euro), la tassa di soggiorno (0,92 euro) e la colazione (16,00 euro). La fattura scompone l'IVA (Imposta sul Valore Aggiunto) applicata al 10% a una parte degli oneri. La fattura menziona anche un controvalore di 484,88 in vecchia valuta francese “Franchi”. Le informazioni di contatto dell'azienda, gli identificativi dell'azienda e l'IVA
Descrizione di Instagram
Crea una descrizione per un post su Instagram per una domenica, sii creativo e divertente per ottenere il miglior coinvolgimento e il miglior numero di Mi piace o commenti
Mood domenicale: sto pianificando la mia prossima avventura parigina. 🥐 Questa auto d'epoca + vista sul fiume = 💯 . Ma la vera domanda è... Brunch con champagne o luppolo al museo? 🤔 Qual è la TUA attività domenicale ideale? Fammi sapere nei commenti! 👇 #ParisianVibes #SundayFunday #ClassicCars #StyleInspo #WeekendGetaway #TravelDreams
Scienza & Educazione
In qualità di esperto, si prega di analizzare scientificamente questa immagine e di restituire una descrizione di 200 parole. Suggerire la migliore specializzazione scientifica per diagnosticare una soluzione.
Questa immagine a raggi X raffigura le ossa di una mano e di un polso umano. Le ossa carpali, i metacarpi e le falangi sono tutti visibili. Sembra esserci una frattura della falange prossimale del quarto dito (anulare). La frattura sembra essere una frattura sminuzzata, il che significa che l'osso è rotto in più frammenti. C'è uno spostamento visibile dei frammenti ossei fratturati, che indica che la frattura non è stabile e potrebbe richiedere un intervento per garantire una corretta guarigione e allineamento. In questa particolare proiezione, non sono evidenti altre fratture o lussazioni evidenti nelle restanti ossa della mano e del polso. La densità ossea appare normale entro i limiti di questa immagine.
Moda & Commercio elettronico
Per una pagina di prodotto ecommerce, descrivi l'immagine con colore, forma, materiali, stile. Descrizione di 100 parole con impatto di marketing.
Osa essere diverso in questo splendido abito nero. Realizzato in morbida maglia aderente al corpo, questo capo presenta un sofisticato dolcevita e una silhouette che valorizza la figura e che raggiunge una lunghezza midi chic. La drammaticità risiede nei voluminosi polsini in pelliccia sintetica, che aggiungono un tocco di texture opulenta e un tocco innegabile. Perfetto per una serata fuori o un evento di tendenza, questo abito è un capolavoro moderno. Chic senza sforzo e infinitamente versatile, preparati a far girare la testa ovunque tu vada. Possiedi la stanza. Possiedi il tuo stile.
Indovinare la geografia
Indovina la posizione dell'immagine, inizia dal paese, dall'area, quindi dalla città. Aggiungi 50 parole per descrivere l'argomento. Termina con una percentuale della stima dell'accuratezza.
Ecco la mia analisi dell'immagine:
- Paese: Francia
- Area: Nuova Aquitania
- Paese: Cap Ferret
Descrizione del soggetto: Una piccola barca dai colori vivaci galleggia tranquillamente sull'acqua, il suo scafo rosso e nero contrasta in modo sorprendente con il blu. Il primo piano è punteggiato da pali di legno che spuntano dall'acqua. Il faro di Arcachon è visibile dietro gli alberi. La spiaggia sabbiosa si estende in lontananza.
Stima dell'accuratezza: 85%
Se hai qualche caso d'uso da condividere con noi, o se vuoi ricevere aiuto su questa nuova funzione di visione AI, faccelo sapere!