|

Light Image Resizer 7.2.1 × Obsługa Ollama AI Vision

Edytor obrazów świetlnych AI Vision został zaktualizowany w celu obsługi Ollama. Możesz teraz wybrać między korzystaniem z rozwiązania w chmurze, takiego jak ChatGPT lub Google Gemini API, lub uruchomić jeden z modeli wizji LLM lokalnie za pomocą Ollama.

Czym jest AI Vision?

AI Vision to funkcja, która opisuje obraz i konwertuje go na tekst.
Możesz go używać na zdjęciach lub zrzutach ekranu, na przykład, aby:

  • Wyodrębnianie słów kluczowych i poprawianie lokalnych wyników wyszukiwania
  • Dodawanie opisów obrazów do metadanych
  • Wykrywanie określonych treści (np. obrazów, na których ludzie się uśmiechają)
  • Łączenie opisu i analizy
  • Wykonaj podstawową ekstrakcję podobną do OCR

See samples and more details about AI VISION in this product page :
https://www.obviousidea.com/ai-vision-describe-image-to-prompt/

Czym jest Ollama AI Vision?

Ollama to program do uruchamiania modeli LLM lokalnie na komputerze.
Możesz Pobierz modele za darmo ze strony internetowej Ollama i uruchamiać je bez połączenia z Internetem.

AI Vision w Light Image Editor

Lekki edytor obrazów jest zawarty w pakiecie Light Image Resizer. Jest to aplikacja systemu Windows do przetwarzania pojedynczych obrazów — edycji, skalowania, a teraz Wizja sztucznej inteligencji.

Dzięki tej funkcji możesz:

  • Dodawanie opisów tekstowych bezpośrednio do metadanych obrazu
  • Używanie niestandardowych podpowiedzi do analizy lub generowania słów kluczowych
  • Przeglądanie poprzednich monitów za pomocą przycisku historii
  • Dostosuj dane wyjściowe w zależności od zawartości obrazu i monitu

Dlaczego wsparcie Ollama jest ważne?

W porównaniu z interfejsami API w chmurze, takimi jak ChatGPT czy Google Gemini, Ollama oferuje dwie kluczowe zalety:

1. Brak kosztów API

Uruchomienie modelu na własnym komputerze oznacza brak kredytów API ani limitów użycia. Możesz analizować tyle obrazów, ile chcesz. Będzie całkowicie darmowy, ponieważ jest to projekt typu open source.

2. Prywatność

Wszystko odbywa się lokalnie — nie ma potrzeby przesyłania prywatnych zdjęć ani dokumentów. Ollama działa w trybie offline lub przez VPN lub tunel Cloudflare, zapewniając zdalny dostęp w Twojej sieci.

Ograniczenia Ollamy dla AI Vision

Nawet jeśli jesteśmy tutaj, aby Ci pomóc, korzystanie z Ollamy wymaga kilku dodatkowych kroków:

  • Zainstaluj oprogramowanie Ollama (łatwe)
  • Uruchom wiersz polecenia, aby pobrać model wizji (zobacz listę tutaj)
  • Wymaga podstawowych umiejętności technicznych (ale możemy pomóc)

Uruchamianie zaawansowanych modeli wizyjnych wymaga również wydajnego sprzętu:

  • Minimum 16 GB RAM
  • Zdecydowanie zaleca się dedykowany procesor graficzny
  • Przetestowaliśmy Ollamę z NVIDIA 4060 Super i 3090 (24 GB VRAM)

Możemy zapewnić doradztwo lub pomoc zdalną (Zoom, Google Meet lub Windows Quick Assist).

Jakie są najlepsze modele do użytku z Ollamą?

Wybór modelu zależy od sprzętu, języka i przypadku użycia.

Oto kilka z nich, które polecamy:

  • ul. Gemma 4B – Szybkie i dobre wsparcie językowe
  • Mistral 3.1 – Wolniejszy, ale dokładny
  • Qwen2.5-VL – Nowy, obiecujący, wart przetestowania

Niektóre modele działają głównie w języku angielskim, podczas gdy inne mogą poprawnie obsługiwać francuski, niemiecki lub hiszpański.

Zobacz okno dialogowe w programie Light Image Editor, aby wybrać model:

Wybierz swój model Ollama w ustawieniach. Gemma , MiniCPM, LLava, Qwen, Granit

Co dalej z Ollamą i AI Vision?

Obecnie AI Vision może działać automatycznie po otwarciu obrazu w Light Image Editor.
Nie jest to jeszcze narzędzie wsadowe, ale integracja z Light Image Resizer może być oparta na opiniach użytkowników.

Ta funkcja jest również częścią naszego #legaltechsoftware Katalog rozwiązań wraz z przypadkami użycia dla:

  • Prawników
  • Profesjonaliści z branży nieruchomości
  • Fotografów

Jeśli jesteś Fotografem korzystającym z Lightrooma, również polecamy projekt Asystent LR AI, specjalizujący się w dodawaniu słów kluczowych i opisów do katalogu Adobe Lightroom.

Daj nam znać, jeśli chcesz, aby ta funkcja poszła dalej! Jak to oczywiste, zintegrujemy go z częścią wsadową Light Image Resizer tylko wtedy, gdy będziemy mieli wyrazy zainteresowania ze strony naszych użytkowników.