Google: Google का अगला Generative AI Editing Tools असली Lense की तरह काम करेंगे और ये तस्वीरों को रीमिक्स करेंगे

Google Veo 2 और Imagen 3 का टेस्टिंग कर रहा है, लेकिन सोचने वाली बात यह है की क्या यह Photo Editors, Video Editors और अन्य Artist के लिए मुसीबत खड़ी कर सकता है?

दिसंबर 22, 2024 - 18:12
जनवरी 7, 2025 - 00:24

हाल ही में पता चला है कि Google एक Generative AI Video Platform, Google Veo का Testing कर रहा है। Google Veo सॉफ्टवेयर में लेंसों वाली फीचर होगी और इससे सिनेमा जैसी पूरी इफ़ेक्ट भी क्रिएट होगी, इससे पता ही नही चलेगा की Video Shooting के द्वारा बनाई गई है या Automatic Generate हुआ है.

इसी सप्ताह एक Blog Post में, Google ने Google Labs पर Veo 2, Updated Imagen 3 Generative Image Platform और Whisk नाम के एक Experimental Program की झलक शेयर की, यह AI का उपयोग करके कई फोटोज के एलिमेंट्स को मिलाकर बनाता है।

Google अपने उपयोगकर्ताओं के लिए अपने Google Labs पर जानकारियां शेयर करता है, Google Labs गूगल का सॉफ्टवेयर टेस्टिंग का प्लेटफार्म है इसपर गूगल अपने सॉफ्टवेयर की टेस्टिंग करता है। Veo 2 Generative AI Modal को लैब में VideoFx के अंतर्गत टेस्ट किया जा सकता है और Imagen 3 की टेस्टिंग ImageFx पर की जाएंगी, इसी के साथ Whisk एक पूरी तरह से अलग टेस्टिंग के लिए जारी किया जायेगा।

ब्लॉग पोस्ट में गूगल का कहना है कि Veo 2, Cinamatography की Visual Effect Language को भी समझता है। उदाहरण के लिए, लोग चाहें तो 18mm लेन्स request कर सकते हैं और सॉफ्टवेयर 18mm के अनुसार पूरा सही तरीके से View देगा। गूगल ने यह भी बताया कि यह प्रोग्राम जमीन की कम या ज्यादा गहराई जैसे शब्दों को भी समझता है और Camera Movement और Framing आदि निर्देशों को भी आसानी से फ़ॉलोअप करता है।

गूगल का कहना है कि Veo 2 वास्तविक दुनिया की बनावट अच्छे तरीके से समझता है, यह Generative AI के लिए बहुत बड़ी चुनौती है, जैसा कि हाल ही में एक वायरल हुए gymnastics video में देखा गया था। Google ने यह भी बताया कि सॉफ़्टवेयर अब मनुष्यों की गतिविधियों और उनकी भावनाओं को बेहतर तरीके से समझता है, साथ ही फालतू की चीजों को कम करता है।

Google Veo की तरह, AI द्वारा बनाए गए Video में SynthID Embdded किया जाएगा, जो एक तरह का Invisible Watermark है, जो फ़ाइल को AI Generated के रूप में पहचान कराता है। SynthID tag वीडियो पर दिखाई नहीं देता, लेकिन यह दूसरे सॉफ़्टवेयर को वीडियो को AI-Generated के रूप में पहचानने में मदद करता है।

गूगल के अनुसार ये Beta Software 4K Quality तक और कई मिनट के वीडियो बना सकते हैं। ये specification बहुत बढ़िया है, क्योंकि इसका कम्पटीटर OpenAI Sora केवल 20 सेकंड तक के FullHD Video बना पाता है।

Updated AI Generator को Google Labs और VideoFX के माध्यम से शुरू में Beta Testers के लिए जारी किया जा रहा है। गूगल उम्मीद कर रहा है कि यह Generative AI Software अगले साल तक YouTube Shorts और अन्य Applications में भी उपलब्ध होगा।

गूगल ने Whisk नामक एक Practical AI की घोषणा की है, जो यूज़र्स को कई images अपलोड करके एक रीमिक्स तैयार करने की सुविधा देता है। यूज़र्स Subject, Views और Style की photos अपलोड कर सकते हैं और साथ ही कुछ भी टेक्स्ट लिख सकते हैं। सॉफ्टवेयर इन सारे डिटेल्स से कुछ नया बनाकर देगा।

कई images को मिलाकर एक नई फ़ाइल बनाने की क्षमता Cinema Actors के बीच कॉपीराइट संबंधी चिंताओं को बढ़ा सकती है, और वो लोग पहले से ही Generative AI को लेकर परेशान हैं।

गूगल का कहना है कि यह Experimental Software Imagen 3 और Gemini को मिलाकर images and text में उपस्थित Material को अच्छी तरह से समझ सकता है। यह सॉफ़्टवेयर फिलहाल testing phase में है और सबसे पहले Google Labs पर लॉन्च किया गया है। अभी के लिए यह केवल अमेरिका में टेस्टिंग के लिए चलाया गया है।

आपकी प्रतिक्रिया क्या है?

like

dislike

love

funny

angry

sad

wow