Vision IA – Description d'une image en texte

AI Vision est la fonction qui permet de décrire une image et de la convertir en une invite. Pour ce faire, on utilise l'un des modèles d'IA les plus répandus, tels que ChatGPT ou Gemini. Vous pouvez choisir le modèle que vous préférez, en fonction de ses performances ou de son coût.

Vision IA : Décrivez des images pour inciter à l’illustration.

Pourquoi décrire vos photos ?

Trouver les bons mots pour vos photos est facile avec Light Image Resizer Fonction AI Vision Dans l’éditeur Light Image Editor. Il analyse vos images à un niveau technique pour générer automatiquement des descriptions. L’application prépare votre image (en la convertissant en JPEG et en la redimensionnant à une taille comme 1024×1024, qui est réglable) pour un traitement efficace de l’IA. Cette étape de pré-analyse permet d’accélérer le traitement et de rendre la fonctionnalité plus rentable. Laissez l’IA faire la description pour que vous n’ayez pas à le faire !

Coucher de soleil à Venise avec gondoles et basilique en vue.

Télécharger Light Image Editor

Télécharger et installer Light Image Resizer 7

Localisez Light Image Editor dans l’icône de la barre d’état, chargez une image et exécutez-la dans le menu principal. – Outils – IA Vision.

Barre d’outils de notification windows avec icône Light Image Editor

Obtenir une clé API

La fonction d’intelligence artificielle AI Vision est disponible pour l’instant dans l’application Light Image Editor. Qui est fourni avec le paquet d’installation de Light Image Resizer. Il s’agit d’une application locale pour Windows uniquement. Vous aurez besoin d’une clé API, soit pour Google Gemini, soit pour ChatGPT d’OpenAI. Cela signifie que vous paierez au fur et à mesure, sans avoir besoin d’un abonnement mensuel.

Tout d’abord, obtenez la clé API des modèles de vision

Obtenir une clé API pour Google AI studio (Gemini)

Obtenir la clé API d’OpenAI (ChatGPT)

Pour l’instant, nous recommandons d’utiliser Gemini, moins cher et qui fonctionne bien pour décrire des images.

Une fois que vous avez la clé (et les crédits), vous pouvez entrer la clé dans l’option de vision IA Light Image Resizer disponible dans ce menu.

Les modèles de vision LLM fonctionnent bien en anglais, en français, en allemand et dans les langues populaires, ce qui n’est pas le cas de certains autres modèles de vision populaires, Ollama pourrait être pris en charge plus tard si vous le trouvez intéressant, et le grand avantage signifie que les données seront entièrement privées et locales, et vous ne serez pas facturé pour les requêtes et les jetons. Voir les modèles de vision pris en charge par Ollama

Quel genre de tâches pouvez-vous accomplir ?

Annotez vos images pour les retrouver par mots-clés. Géodeviner l’image quand on ne se souvient plus où on l’a prise. Trouvez l’inspiration lorsque vous souhaitez publier une nouvelle publication Instagram ou TikTok. Il ajoutera de belles icônes pour améliorer votre marketing.

Tout dépend de votre prompt, voyez quelques exemples de prompts et comment cela influe sur le résultat.

Une fois que vous avez la clé (et les crédits), vous pouvez entrer la clé dans l’option de vision IA Light Image Resizer disponible dans ce menu.

Les modèles de vision LLM fonctionnent bien en anglais, en français, en allemand et dans les langues populaires, ce qui n’est pas le cas de certains autres modèles de vision populaires. Ollama pourrait être pris en charge plus tard si vous le trouvez intéressant, et le gros avantage est que les données seront complètement privées et locales, et vous ne serez pas facturé pour les requêtes et les jetons. Voir les modèles de vision pris en charge par Ollama

Quelle est la différence entre décrire une image, analyser une image, résumer une image ?

Et cela pourrait être la même question sur la différence entre une image, une photographie et une image. C’est un peu la même chose, mais cela dépend de ce que vous devez faire et de qui vous êtes. Voir quelques tâches de Vision IA possibles :

  • Trouver des mots-clés pour les photographes
  • OCR et document de synthèse pour les comptables
  • Sous-titres automatiques des images
  • Inspiration d’influence pour une publication Instagram ou Tiktok
  • Identifier les marques et les célébrités
  • E-commerce de mode
  • Géodeviner – Trouver l’emplacement à partir de la photo
  • Diagnostic scientifique, santé, astronomie

Quelques inspirations d’invites pour décrire une image

Mots-clés pour la photographie

Retournez directement sans commentaire une liste de 50 mots-clés séparés par une virgule pour décrire le sujet, l’arrière-plan, les objets, le lieu et l’ambiance

Femme dans la voiture, chameaux sur fond de désert.

Femme, cabriolet, voiture, désert, chameaux, sable, route, Voyage, tourisme, aventure, vacances, élégant, mode, portrait, en plein air, ensoleillé, vent, cheveux, cheveux roux, écharpe, voiture blanche, sièges en cuir, appui-tête, paysage sec, aride, chaleur, lumière du soleil, modèle, posant, confiant, détendu, attraction touristique, horizon, Contexte, lointain, flou, flou, flou, transport, décalé, loisir, envie de voyager, moderne, tendance, vogue, élégant, élégance, liberté, voyage, explorateur, Éloigné, Pittoresque, Destination, Décontracté, Été, Jour, Vacances, Évasion, Aventure, Voyage, Voyage en voiture.

OCR et Résumé de documents

Effectuez un OCR détaillé du document, puis traduisez en anglais et expliquez en un résumé de 200 mots ce qu’est le document et les éléments importants.

Facture de l’hôtel pour la chambre et les services.

Ce document est une facture de “Les Minotiers,” un Logis de France situé à Mirepoix. La facture, numérotée 43197 et datée du 18 février 2014, détaille les frais pour un séjour en chambre 12. L’invité est arrivé le 17 février 2014 et est reparti le 18 février 2014. Le montant total dû est de 73,92 euros. Les frais comprennent le prix de la chambre (57,00 euros), la taxe de séjour (0,92 euros) et le petit-déjeuner (16,00 euros). La facture détaille la TVA (taxe sur la valeur ajoutée) appliquée à 10 % sur une partie des charges. La facture mentionne également une valeur équivalente de 484,88 en ancienne monnaie française “Francs”. Les coordonnées de l’entreprise, les identifiants de l’entreprise et la TVA

Instagram Description

Créez une description pour une publication Instagram pour un dimanche, soyez créatif et amusant pour obtenir le meilleur engagement et le meilleur nombre de likes ou de commentaires

Homme debout près d’une voiture de collection sous le pont

Humeur du dimanche : préparer ma prochaine aventure parisienne. 🥐 Cette voiture classique + vue sur la rivière = 💯 . Mais la vraie question est... Brunch au champagne ou visite des musées ? 🤔 Quelle est VOTRE activité dominicale idéale ? Faites-le moi savoir dans les commentaires ! 👇 #ParisianVibes #SundayFunday #ClassicCars #StyleInspo #WeekendGetaway #TravelDreams

Science & Éducation

En tant qu’expert, veuillez analyser scientifiquement cette image et renvoyer une description de 200 mots. Proposez la meilleure spécialité scientifique pour diagnostiquer une solution.

Radiographie des os de la main et du poignet humains.

Cette radiographie représente les os d’une main et d’un poignet humains. Les os du carpe, les métacarpiens et les phalanges sont tous visibles. Il semble y avoir une fracture de la phalange proximale du quatrième doigt (annulaire). La fracture semble être une fracture comminutive, ce qui signifie que l’os est brisé en plusieurs fragments. Il y a un déplacement visible des fragments d’os fracturés, indiquant que la fracture n’est pas stable et peut nécessiter une intervention pour assurer une cicatrisation et un alignement appropriés. Aucune autre fracture ou luxation évidente n’est apparente dans les os restants de la main et du poignet dans cette projection particulière. La densité osseuse semble normale dans les limites de cette image.

Mode & Commerce électronique

Pour une page de produit de commerce électronique, décrivez l’image avec la couleur, la forme, les matériaux, le style. Description de 100 mots avec impact marketing.

Robe noire avec poignets moelleux

Osez la différence dans cette superbe robe noire. Confectionné à partir d’une maille douce et moulante, ce modèle est doté d’un col roulé sophistiqué et d’une silhouette flatteuse qui tombe sur une longueur midi chic. Le drame réside dans les poignets volumineux en fausse fourrure, ajoutant une touche de texture opulente et un avantage indéniable. Parfaite pour une soirée ou un événement marquant, cette robe est un chef-d’œuvre moderne. Chic sans effort et infiniment polyvalent, préparez-vous à faire tourner les têtes où que vous alliez. Appropriez-vous la pièce. Appropriez-vous votre style.

Détection Géographique

Devinez l’emplacement de la photo, commencez par le pays, la région, puis la ville. Ajoutez 50 mots pour décrire le sujet. Terminez avec un pourcentage de l’estimation de la précision.

Bateau sur l’eau avec vue lointaine sur le phare.

Voici mon analyse de l’image :

  • Pays: France
  • Aire: Nouvelle-Aquitaine
  • Ville: Cap Ferret

Description du sujet : Un petit bateau peint de couleurs vives flotte calmement sur l’eau, sa coque rouge et noire contrastant avec le bleu. Le premier plan est parsemé de poteaux en bois qui sortent de l’eau. Le phare d’Arcachon est visible derrière les arbres. La plage de sable s’étend au loin.

Estimation de la précision : 85 %

Si vous avez un cas d’utilisation à partager avec nous, ou si vous souhaitez obtenir de l’aide sur cette nouvelle fonctionnalité de vision IA, n’hésitez pas à nous le faire savoir !

Contact