Pirmą kartą „Midjourney“ pateikia nuoseklias asmenybes viešiems AI vaizdams

Posted On: 12 kovo, 2024
Posted By: Morton Corbyn
Comments: 0

Prisijunkite prie „Leaders“ Bostone kovo 27 d. ir dalyvaukite išskirtiniame tinklų kūrimo, idėjų ir pokalbių vakare. Prašyk kvietimo čia.

Garsioji dirbtinio intelekto vaizdo generavimo paslauga Skrydžio viduryje Ji išleido vieną iš labiausiai pageidaujamų funkcijų: galimybę nuosekliai atkurti simbolius naujuose vaizduose.

Iš prigimties tai iki šiol buvo pagrindinė kliūtis dirbtinio intelekto vaizdų generatoriams.

Taip yra todėl, kad dauguma AI vaizdo generatorių remiasi „Difuzijos modeliai“, įrankiai, panašūs į „Stability AI“ atvirojo kodo vaizdų generavimo algoritmą „Stable Diffusion“, kuris veikia apytiksliai, paimant vartotojo įvestą tekstą ir bandant sudaryti tą aprašymą atitinkantį vaizdą po pikselius, kaip mes nustatėme. išmoko iš panašių eksperimentų su vaizdais ir teksto žymomis grupėje Didžiuliai (ir prieštaringi) mokymo duomenys, susidedantys iš milijonų žmonių sukurtų vaizdų.

Kodėl nuoseklios asmenybės yra tokios galingos ir nepagaunamos kuriant dirbtinį intelektą

Tačiau, kaip ir naudojant didelius teksto kalbos modelius (LLM), pvz., OpenAI ChatGPT ar naująją Cohere Command-R, visų generuojamųjų AI programų problema yra atsakymų nenuoseklumas: AI sukuria kažką naujo kiekvienam atskiram į jį įvestam raginimui. , net jei teiginys kartojamas arba naudojami tie patys raktiniai žodžiai.

VB renginys

Dirbtinio intelekto poveikio turas – Bostonas

Nekantriai laukiame kitos AI Impact Tour stotelės Bostone kovo 27 d. Šiame išskirtiniame, tik remiamame renginyje, bendradarbiaujant su „Microsoft“, bus diskutuojama apie geriausią duomenų integravimo praktiką 2024 m. ir vėliau. Vietų skaičius ribotas, todėl paprašykite kvietimo šiandien.

Paprašykite pakvietimo

Tai puikiai tinka kuriant visiškai naujus turinio elementus – „Midjourney“ atveju vaizdus. O kas, jei kuriate filmą, romaną, grafinį romaną, komiksą ar kitą jums patinkančią vaizdinę laikmeną Tas pats Personažas ar personažai, per kuriuos reikia judėti ir pasirodyti skirtingose scenose ir aplinkoje, su skirtingomis veido išraiškomis ir rekvizitais?

READ „Sony“ grasina „Dbrand“ teisiniais veiksmais dėl PS5 lentų

Šį tikslų scenarijų, kuris paprastai yra būtinas pasakojimo tęstinumui, iki šiol buvo labai sunku pasiekti naudojant generatyvųjį AI. Tačiau „Midjourney“ dabar sprendžia šią problemą, pristatydama naują žymą „–cref“ (sutrumpintai iš „simbolių nuorodos“), kurią vartotojai gali įtraukti į savo teksto raginimus „Midjourney Discord“ programoje ir bandys suderinti veikėjo veidą. Ypatybės, kūno tipas ir net drabužiai iš URL, kurį naudotojas įklijuoja į kitą minėtą žymą.

Funkcijai tobulėjant ir tobulėjant, „Midjourney“ gali tapti ne tik šauniu žaidimu ar idėjų šaltiniu, bet ir tapti profesionalesniu įrankiu.

Kaip naudotis nauja nuoseklia „Midjourney“ asmenybės savybe

Žyma geriausiai veikia su anksčiau sukurtais Midjourney vaizdais. Taigi, pavyzdžiui, vartotojo darbo eiga būtų sukurti arba nuskaityti anksčiau sugeneruoto simbolio URL.

Pradėkime nuo nulio ir sakykime, kad kuriame naują personažą su šiuo raginimu: „Plikas, raumeningas vyras su karoliuku ir akių lopeliu“.

Atnaujinsime mums labiausiai patinkantį vaizdą, tada paspauskite „Control“ ir spustelėkite jį „Midjourney Discord“ serveryje, kad rastumėte parinktį „Kopijuoti nuorodą“.

Tada galime parašyti naują raginimą „Dėvėkite baltą smokingą stovėdami viloje“. [URL]“ ir įklijuokite ką tik sukurto vaizdo URL, o „Midjourney“ bandys sukurti tą patį simbolį, kaip ir anksčiau, naujai įvestame nustatyme.

Kaip pamatysite, rezultatai toli gražu neatitinka pradinio skaičiaus (ar net mūsų pradinio teiginio), tačiau jie tikrai teikia vilčių.

Be to, vartotojas gali tam tikru mastu kontroliuoti naujojo vaizdo „svorį“ su originaliu simboliu, taikydamas vėliavėlę „-cw“ ir skaičių nuo 1 iki 100 iki naujo raginimo pabaigos ( po “-cref [URL]“, taigi taip: „-cref [URL] – CW 100.“ Kuo mažesnis „CW“ skaičius, tuo didesnis kontrastas gautame vaizde. Kuo didesnis „CW“ skaičius, tuo naujas vaizdas labiau atitinka pradinę nuorodą.

READ „Redfall“ gauna pirmąjį pagrindinį atnaujinimą ir vis dar trūksta 60 kadrų per sekundę našumo režimo

Kaip matote mūsų pavyzdyje, labai žemai įvedus „cw 8“, iš tikrųjų buvo gauta tai, ko norėjome: baltą smokingą. Nors dabar jis pašalino mūsų veikėjo parašą.

Na, nėra nieko, ko „skirtinga sritis“ negalėtų sutvarkyti – tiesa?

Na, akies pleistras buvo uždėtas ant ne tos akies… bet mes ten!

Taip pat galite sujungti kelis simbolius į vieną naudodami dvi „–cref“ žymas kartu su atitinkamais URL.

Ši funkcija buvo pristatyta anksčiau šį vakarą, tačiau menininkai ir kūrėjai ją išbando dabar. Išbandykite patys, jei turite Midjourney. Ir perskaitykite visą įkūrėjo Davido Holzo pastabą šiuo klausimu žemiau:

Sveiki, @visi čia, šiandien išbandome naują simbolių nuorodos funkciją, kuri yra panaši į funkciją Pattern Reference, išskyrus tai, kad ji bando, kad simbolis atitiktų simbolių nuorodos vaizdą, užuot suderinęs nuorodos šabloną.

Kaip tai veikia

Jis rašo --cref URL Kai būsite paraginti įvesti profilio nuotraukos URL
tu gali naudoti --cw Norėdami reguliuoti nuorodos „stiprumą“ nuo 100 iki 0
Stiprumas 100 (--cw 100) Numatytasis ir naudojamas veidas, plaukai ir drabužiai
(labai 0)--cw 0) sutelks dėmesį tik į veidą (tinka persirengti/plaukams ir pan.)

Kam jis skirtas

Ši funkcija geriausiai veikia, kai naudojami simboliai, sukurti iš Midjourney vaizdų. Jis nėra skirtas tikriems žmonėms / vaizdams (ir greičiausiai juos iškraipys, kaip tai daro įprasti vaizdo raginimai)
Cref veikia panašiai kaip įprasti vaizdo raginimai, išskyrus tai, kad jis „susitelkia“ į charakterio bruožus
Šios technikos tikslumas ribotas, ji tiksliai neatkartos įdubimų/strazdanų/ar marškinių logotipų.
Cref veikia su įprastais Niji ir MJ modeliais, taip pat gali būti derinamas su --sref

Išplėstiniai nustatymai

Norėdami maišyti informaciją / simbolius iš kelių tokių vaizdų, galite naudoti daugiau nei vieną URL --cref URL1 URL2 (Tai panašu į kelių vaizdų ar stiliaus raginimus)

Kaip tai veikia alfa žiniatinklyje?

Vilkite arba įklijuokite vaizdą į vizualizacijos juostą, kur jame dabar yra trys piktogramos. Nurodykite šias grupes, ar tai vaizdo vektorius, stiliaus nuoroda ar simbolių nuoroda. Shift + pasirinkite parinktį, kad vaizdas būtų naudojamas kelioms kategorijoms

Atminkite, nors MJ V6 yra alfa stadijoje, kitos funkcijos gali staiga pasikeisti, tačiau netrukus pasirodys oficiali V6 beta versija. Norėtume pasidalinti visų mintimis apie idėjas ir funkcijas ir tikimės, kad jums patiks šis ankstyvas leidimas ir tikimės, kad jis padės jums kuriant istorijas ir pasaulius.

„VentureBeat“ misija Tai bus skaitmeninė miesto aikštė, skirta techninius sprendimus priimantiems asmenims įgyti žinių apie transformacines ir sandorių įmonių technologijas. Atraskite mūsų santraukas.

READ Kodėl dirbtinio intelekto „krikštatėvis“ Jeffrey Hintonas pasitraukė iš „Google“ ir pasisakė apie statymus

Morton Corbyn

Morton Corbyn yra „Kriptovaliutos.org“ autorius, rašantis apie naujienas, politiką, verslą, technologijas, sportą, pramogas ir gyvenimo būdą. Jo tekstuose daug dėmesio skiriama aiškiam informacijos pateikimui, aktualijų kontekstui ir skaitytojams naudingoms įžvalgoms. Autorius siekia pateikti patikimą ir suprantamai išdėstytą informaciją apie svarbiausius įvykius bei tendencijas, kurios formuoja šiuolaikinį pasaulį. Turinys orientuotas į kasdien aktualias temas ir skaitytojui svarbias naujienas.