Apple wprowadza na rynek edytor obrazów AI o otwartym kodzie źródłowym MGIE

W dziedzinie cyfrowej edycji obrazów niedawna prezentacja przez firmę Apple systemu MGIE (Multimodal Large Language Model-Guided Image Editing) stanowi ważny krok. To najnowocześniejsze narzędzie AI wykorzystuje możliwości dużych modeli językowych do interpretacji i wykonywania złożonych, opartych na instrukcjach edycji obrazów, zapewniając użytkownikom niespotykany dotąd poziom kontroli i elastyczności. Innowacyjne podejście MGIE łączy w sobie moc wprowadzania tekstu i obrazu, aby ułatwić wprowadzanie korekt przypominających Photoshopa, globalne ulepszanie zdjęć i precyzyjne lokalne edycje z niezwykłą wydajnością.

Jabłko MGIE

Rozwój MGIE ucieleśnia zaangażowanie Apple w przesuwanie granic technologii i kreatywności, zapewniając platformę, która nie tylko upraszcza wyrafinowane zadania edycyjne, ale także zachęca do współpracy i innowacji w społeczności open source. Integrując multimodalne techniki uczenia się, MGIE znacząco udoskonala poprzednie systemy edycji obrazu, umożliwiając bardziej wyraziste i dokładne interpretacje instrukcji użytkownika. Zapewnia konkurencję typu open source dla systemów takich jak Midjourney i DallE 3 OpenAI.

Edytor obrazów typu open source

W ostatnich latach skrzyżowanie sztucznej inteligencji i narzędzi kreatywnych doprowadziło do rewolucyjnego postępu w sposobie interakcji z mediami cyfrowymi. Wprowadzenie przez firmę Apple systemu MGIE jest świadectwem tej ciągłej transformacji, ustanawiającej nowy standard kreatywności opartej na sztucznej inteligencji.

MGIE (MLLM-Guided Image Editing) to model sztucznej inteligencji typu open source opracowany we współpracy z badaczami z Uniwersytetu Kalifornijskiego. Model ten, wyróżniający się możliwością wykonywania złożonych manipulacji obrazami w oparciu o instrukcje w języku naturalnym, opiera się na multimodalnych modelach dużego języka (MLLM) w celu dokładnej interpretacji żądań użytkowników. MGIE umożliwia wykonywanie szerokiego zakresu edycji, od globalnych ulepszeń zdjęć, takich jak regulacja jasności i kontrastu, po edycje lokalne i edycje podobne do Photoshopa, takie jak przycinanie, zmiana rozmiaru i dodawanie filtrów.

iOS 18

Jego zdolność rozumienia i wykonywania poleceń, takich jak zdrowsza pizza lub zmiana ostrości zdjęcia, jest świadectwem jego zaawansowanego zdrowego rozsądku i umiejętności manipulacji z poziomu dłoni. pixel. Rozwój MGIE, zaprezentowany na Międzynarodowej konferencji na temat reprezentacji uczenia się (ICLR) w 2024 r. i dostępny w GitHub, stanowi dla Apple ważny krok naprzód w badaniach nad sztuczną inteligencją, śledząc uważnie inne ważne projekty AI i przewidywania dotyczące generatywnych funkcji AI w iOS 18.

MGIE stanowi pomost pomiędzy zaawansowanymi możliwościami sztucznej inteligencji a przyjazną dla użytkownika edycją obrazu, umożliwiając mnóstwo edycji, od ogólnego ulepszania zdjęć, takiego jak regulacja jasności, kontrastu i ostrości, po kompleksowe edycje, bardziej ukierunkowane lokalizacje, które mogą zmieniać kształt, rozmiar, kolor lub teksturę określonych elementów obrazu. Ponadto doskonale radzi sobie z operacjami podobnymi do Photoshopa, takimi jak kadrowanie, zmiana rozmiaru, obracanie i stosowanie różnych filtrów, zapewniając użytkownikom niespotykany dotąd poziom kontroli nad ich cyfrowymi środowiskami.

Multimodalna edycja obrazu prowadzona przez rozszerzony model językowy

Jednym z najbardziej godnych uwagi aspektów MGIE jest jego zdolność do kierowania się zdrowym rozsądkiem, co pozwala mu wykonywać takie zadania, jak dodawanie dodatków warzywnych do pizzy, aby wyglądała zdrowiej, lub poprawianie kontrastu zdjęcia w celu symulowania dodatkowego światła. Ten poziom intuicyjnej obsługi toruje drogę do bardziej kreatywnej i spersonalizowanej edycji obrazu, przesuwając granice tego, co można osiągnąć dzięki technologii AI.

Współpraca z Uniwersytetem Kalifornijskim i prezentacja MGIE podczas Międzynarodowej Konferencji na temat reprezentacji uczenia się (ICLR) w 2024 r. stanowią ważny kamień milowy w wysiłkach Apple w zakresie badań nad sztuczną inteligencją. Dostępne w GitHub rozwiązanie MGIE zachęca do dalszych poszukiwań i rozwoju, zapewniając dostęp do swojego kodu, danych i wstępnie wyszkolonych modeli całym społecznościom naukowym i kreatywnym.

Badania nad generowaniem i manipulacją obrazami AI

Inicjatywa ta wpisuje się w szersze zaangażowanie firmy Apple w badania nad sztuczną inteligencją, o czym świadczą niedawne osiągnięcia Apple we wdrażaniu dużych modeli językowych na iPhone'ach i innych urządzeniach z ograniczoną pamięcią. Rozwój konkurencyjnej platformy „Apple GPT” i platformy „Ajax” dla dużych modeli językowych podkreśla zaangażowanie firmy w rozwój technologii sztucznej inteligencji. Ponadto oczekiwanie na pojawienie się generatywnych funkcji sztucznej inteligencji w iOS 18, w tym ulepszoną wersję Siri z funkcjonalnością podobną do ChatGPT, sygnalizuje znaczącą zmianę w sposobie integracji sztucznej inteligencji z urządzeniami każdego człowieka. zdaniem analityków branżowych.

MGIE to nie tylko narzędzie, ale także zwiastun przyszłości cyfrowej kreatywności, ponieważ wypełnia lukę pomiędzy innowacjami technologicznymi a ekspresją artystyczną. Rozwój i dystrybucja oprogramowania open source podkreśla wizję Apple dotyczącą świata, w którym technologia służy nie tylko poprawie produktywności, ale także wspieraniu kreatywności i osobistej ekspresji za pomocą intuicyjnych, dostępnych i wydajnych narzędzi. Oczekuje się, że w miarę rozwoju MGIE na nowo zdefiniuje krajobraz edycji obrazów, udostępniając szerszemu gronu odbiorców zaawansowane manipulacje obrazami oparte na sztucznej inteligencji i zachęcając do nowej ery sztuki cyfrowej.

Czytaj więcej Przewodnik:

Zostaw komentarz

Twoj adres e-mail nie bedzie opublikowany. Wymagane pola są oznaczone *