|

Light Image Resizer 7.2.1 × Ollama prend en charge AI Vision

Light Image Editor AI Vision a été mis à jour pour prendre en charge Ollama. Vous pouvez désormais choisir d’utiliser une solution cloud telle que ChatGPT ou l’API Google Gemini, ou d’exécuter l’un des modèles de vision LLM localement à l’aide d’Ollama.

Qu’est-ce que la vision IA ?

AI Vision est la fonctionnalité qui décrit une image et la convertit en texte.
Vous pouvez l’utiliser sur des photos ou des captures d’écran par exemple, pour :

  • Extraire des mots-clés et améliorer les résultats de recherche locale
  • Ajouter des descriptions d’images aux métadonnées
  • Détecter des contenus spécifiques (par exemple, des images où les gens sourient)
  • Combiner description et analyse
  • Effectuer une extraction de base de type OCR

Qu’est-ce qu’Ollama AI Vision ?

Ollama est un programme permettant d’exécuter des modèles LLM localement sur votre ordinateur.
Vous pouvez Télécharger les modèles gratuitement à partir du site Web d’Ollama et exécutez-les sans connexion Internet.

AI Vision dans Light Image Editor

Light Image Editor est inclus dans le forfait de Light Image Resizer. Il s’agit d’une application Windows permettant de traiter des images uniques, de les modifier, de les mettre à l’échelle et maintenant Vision par IA.

Grâce à cette fonctionnalité, vous pouvez :

  • Ajouter des descriptions textuelles directement dans les métadonnées de l’image
  • Utiliser des invites personnalisées pour l’analyse ou la génération de mots-clés
  • Passez en revue les invites précédentes à l’aide du bouton d’historique
  • Adaptez la sortie en fonction du contenu de l’image et du prompt

Pourquoi le support d’Ollama est-il important ?

Par rapport aux API cloud comme ChatGPT ou Google Gemini, Ollama offre deux avantages clés :

1. Pas de frais d’API

L’exécution du modèle sur votre propre machine signifie qu’il n’y a pas de crédits d’API ni de limites d’utilisation. Vous pouvez analyser autant d’images que vous le souhaitez. Il sera entièrement gratuit car il s’agit d’un projet open-source.

2. Confidentialité

Tout reste local : pas besoin de télécharger des photos ou des documents privés. Ollama fonctionne hors ligne, ou via un VPN ou un tunnel Cloudflare pour un accès à distance au sein de votre réseau.

Limites d’Ollama pour la vision IA

Même si nous sommes là pour vous aider, l’utilisation d’Ollama nécessite quelques étapes supplémentaires :

  • Installer le logiciel Ollama (facile)
  • Exécutez une ligne de commande pour télécharger un modèle de vision (voir la liste ici)
  • Nécessite des compétences techniques de base (mais nous pouvons vous aider)

L’exécution de modèles de vision avancés nécessite également un matériel puissant :

  • Minimum 16 Go de RAM
  • Un GPU dédié est fortement recommandé
  • Nous avons testé Ollama avec des NVIDIA 4060 Super et 3090 (24 Go de VRAM)

Nous pouvons fournir des conseils ou une aide à distance (Zoom, Google Meet ou Windows Quick Assist).

Quels sont les meilleurs modèles à utiliser avec Ollama ?

Le choix du modèle dépend de votre matériel, de votre langue et de votre cas d’utilisation.

En voici quelques-uns que nous recommandons :

  • Gemma 4B – Prise en charge linguistique rapide et de qualité
  • Mistral 3.1 – Plus lent mais précis
  • Qwen2.5-VL – Nouveau, prometteur, qui vaut la peine d’être testé

Certains modèles fonctionnent principalement en anglais, tandis que d’autres peuvent prendre en charge correctement le français, l’allemand ou l’espagnol.

Consultez la boîte de dialogue dans Light Image Editor pour choisir votre modèle :

Sélectionnez votre modèle Ollama dans les paramètres. Gemma , MiniCPM, LLava, Qwen, Granite

Quelle est la prochaine étape avec Ollama et AI Vision ?

Actuellement, AI Vision peut s’exécuter automatiquement lorsqu’une image est ouverte dans Light Image Editor.
Il ne s’agit pas encore d’un outil de traitement par lots, mais l’intégration dans Light Image Resizer peut se faire en fonction des commentaires des utilisateurs.

Cette fonctionnalité fait également partie de notre #legaltechsoftware Catalogue de solutions, avec des cas d’utilisation pour :

  • Avocats
  • Professionnels de l’immobilier
  • Photographes

Si vous êtes un photographe utilisant Lightroom, nous vous recommandons également le projet Assistant IA LR, spécialisé dans l’ajout de mots-clés et de descriptions à votre catalogue Adobe Lightroom.

Faites-nous savoir si vous souhaitez que cette fonctionnalité aille plus loin ! Comme Obviousidea ne l’intégrera dans la partie lot Light Image Resizer que si nous avons des manifestations d’intérêt de la part de nos utilisateurs.