Аутор Тема: "Историјске" фотографије генерисане вештачком интелигенцијом (Прочитано 53974 пута)

НикПав

Цитат: Небо_Сав Јун 01, 2025, 06:40:43 поподне

Питао сам се да ли ће ChatGPT препознати контекст и какав ће бити његов коментар о Лалошу Купусовићу Лисици само на основу фотографије, и ево шта је одговорио:

Слатко сам се исмејао. Имао сам бабу у Доње Синковце, скоро па Synthovac

Баш ћу да пробам да напишем текстове по насловима из биографије, да фикцију пребацим у реалност.

Небо_Сав

Цитат: НикПав Јун 08, 2025, 04:38:14 поподне

Слатко сам се исмејао. Имао сам бабу у Доње Синковце, скоро па Synthovac

Баш ћу да пробам да напишем текстове по насловима из биографије, да фикцију пребацим у реалност.

Да, управо сам на то рачунао кад сам написао да су наслови инспиративни... Само напред, надам се да ћеш поделити уратке! ..

НикПав

Када трактор стане, Лалошев велики хит са албума 1987.

https://suno.com/s/KBvKN1B8BCb5RMXR

И редак Лалошев лајв снимак са вашара у Крушевици 1990.

https://suno.com/s/UH3NqFyaV1oKriUJ

Са најновијом верзијом, Суно је коначно дозволио већи креативни уплив. За ову песму сам ја одрадио вокалну мелодију, отпевао сам целу песму и урадио upload, Суно је одрадио инструментал, аранжман и глас. Неке моје песме сам успео целе да добијем у Суно, певајући "на,на,на" у инструменталним деловима.

drajver

Сад баш гледам нови спот Томпсона под називом Краљ Томислав. Морам признати да одавно нисам одгледао нешто патетичније и глупље. И то не са позиције Србина који гледа Томпсонов спот па има у старту неке предрасуде, већ заиста објективно, од текста до музике, ради се о прворазредном трешу. Ко може купити карту и ићи да то слуша на концерту, није ми јасно, нисам издржао до краја пјесме.

Међутим, друга ми је ствар била у овом споту интересантна,а то је максимално и прилично примитивно кориштење вјештачке интелигенције у визуелном приказу.

Пробао сам више видео AI сервиса протеклих мјесеци, међу њима и оне најквалитетније, али генерално мислим да се кључни проблем са AI генерацијом своди на проблем са конзистентношћу. Без обзира што већина сервиса већ сада нуди тобоже конзистентне карактере, у пракси то веома тешко иде. Није проблем да се изгура један кадар са приличном реалистичношћу карактера, али шта се дешава када исти карактер треба остати сталан кроз више кадрова. Не видим да се тај проблем успјешно рјешава и питам се да ли AI у том смислу има системску грешку, тј. да ли ће се икада моћи снимити дугометражни филм коришћењем само AI. Оно што се често истиче као предност AI, прављење великог броја варијација, би заправо могла да буде њена највећа мана. Како човјек уопште може "укротити" хаос?

Што се тиче визелних приказа, попут спотова, реклама, нема сумње да ће се убудуће користити јефтинија опција тј. AI. Биће битно да ради посао (попут овог Томпсоновог спота) и публика ће се вјероватно временом навикавати да гледа AI садржај умјесто human made. Као што данас користи јефтинији намјештај од иверице умјесто скупљег намјештаја од пуног дрвета. Human made садржај можда ту има шансе за преживљавање, биће скупљи и правиће се за богатије. Већ сад видим да има покушаја да се сертификује human made (no-AI) путем неких печата, а и сама реклама на неким AI производима типа Make AI Content human или Humanize with undetectable AI, говори да је људски произведен садржај ипак оно што је идеал.

drajver

Поставио сам ChatGPT питање: зашто вјештачка интелигенција не може ријешити проблем конзистентних карактера?

Одговор ChatGPT-а:

Одлично питање — зашто вештачка интелигенција (AI) често има проблем са конзистентношћу ликова у текстовима, причама или сценаријима? Ово је посебно приметно у романима, серијама, стриповима, па и играма. Ево зашто се то дешава и где је ограничење:

🔍 1. Нема стварно разумевање идентитета
AI модели попут мене (GPT-4/o4) не разумеју ликове као особе са унутрашњим животом, мотивацијама и доследним психолошким профилима. Ми радимо с обрасцима:

Када пишемо причу, предвиђамо следећу реч на основу свега што смо већ видели у тексту.

Немамо дугорочни „ум“ који би рекао: „Овај лик не би тако реаговао јер је сталожен и логичан.“

🧠 2. Краткорочна меморија
Иако GPT модели имају релативно велику „меморију“ (контекстни прозор), то је и даље ограничено:

Ако се лик појави на почетку романа, AI га може заборавити или изменити након 10.000+ речи.

Стилови, понашања или чак имена могу се променити јер нема глобалне мапе карактера.

✍️ 3. Недостатак „мета-свести“
Људски аутори често имају интерну логику за ликове: знају шта би они урадили у одређеној ситуацији.

AI то не „зна“ — не размишља:

„Како би Ана реаговала на издају, с обзиром на њен однос с оцем?“

Уместо тога, AI предлаже оно што је статистички вероватно на основу сличних описа у тренинзима.

🧰 4. Нема интерну базу карактеристика
Без посебног система за управљање ликовима (нпр. структура особина, односа, унутрашњих конфликата), AI не зна:

Ко је коме брат, љубавник, непријатељ…

Шта један лик зна, а други не зна (проблем „знања из перспективе“).

🧪 Могућа решења (која се развијају):
Екстерни алати за управљање ликовима
– Нпр. Story Engine системи (као у Sudowrite) прате особине и односе.

Фајн-тјуновање с правилима наратива
– Тренирање AI-а да препознаје емотивну и психолошку доследност.

Вишеслојни модели с меморијом
– Развијају се модели с дугорочном меморијом (нпр. у OpenAI „memory“ експериментима).

Промпт-базирани системи
– Нпр. стално понављање карактеристика лика у промпту:
„Ана је хладна, логична и не верује никоме од почетка...“

📌 Закључак:
AI не успева да одржи конзистентне ликове јер:

нема дубоко разумевање психологије,

користи ограничену меморију контекста,

предвиђа текст статистички, а не наративно,

нема свест о прошлим поступцима и развоју ликова.

drajver

Сличан је одговор и што се тиче визуелне конзистентности ликова.

Зашто вјештачка интелигенција конзистентност ликова не може задржати и у визуелном генерисању слика или видеа?

ChatGPT said:
Одлично и дубоко питање:
Зашто вјештачка интелигенција не може задржати конзистентност ликова у визуелном генерисању — као што су слике или видео?

Ево разлога, објашњених јасно и конкретно:

🎭 1. Генерација слика је независна — нема „свјест о ликовима“
AI генератори слика као што су Midjourney, DALL·E, Stable Diffusion, итд., не имају унутрашњи модел лика као јединственог идентитета.

Свака слика се генерише одвојено, чак и ако упишеш истог „лика“.

Они не разумеју да је то иста особа — виде само опис (нпр. „црнокоса жена у црвеном капуту“) и то реплицирају изнова.

Резултат:
➡ Исти лик на једној слици може имати другачије лице, старост, стил, па чак и пол на другој.

🧬 2. Нема „семантичке ДНК“ лика
Људски ум може препознати да је Ана и даље Ана чак и кад је у другој одјећи или осветљењу.
AI, с друге стране, не прави унутрашњу „генетску карту“ лика (црте лица, осмех, поглед, облик носа, итд.).

Оно што ми зовемо „лик“ за AI је само скуп пиксела базиран на опису.

Чак и мали описни варијације могу драматично променити резултат.

🧠 3. Визуелна меморија је „плитка“
AI тренутно нема дугорочну визуелну меморију:

Ако желиш серију слика (нпр. лик у различитим ситуацијама), свака мора бити пажљиво контролисана.

Нема меморије унутар сесије која би рекла: „Ово је исти лик као претходни пут.“

🎞️ 4. Видео генерација је још тежа
AI алати за видео (нпр. Runway, Sora, Pika, Dream Machine) раде тако што генеришу оквире један за другим:

Ако не постоји чврста визуелна контрола (нпр. референтна слика), лик се деформише током видеа — лице „плута“, одећа мијења боју, положај очију варира.

Стабилност карактера у времену је неријешен проблем у AI видеу.

🧰 Како се ово решава (делимично):
Контролне технике – ControlNet, pose guides, reference images.

"Character tokens" – неки системи омогућавају да се дефинише „Ана“ као лик и да се позива.

Фине-тјуновани модели – ако имаш много слика истог лика, можеш тренирати персонализовани модел.

Ручно уређивање/постпродукција – у продукцији се често користи Photoshop, After Effects итд. да се досљедност „исфилује“.

📌 Закључак:
AI не може лако задржати визуелну конзистентност ликова јер:

свака слика/видео се ствара одвојено, без свијести о идентитету,

не постоји унутрашња репрезентација лика као „особе“,

описни текст није довољан да одржи исти изглед,

алати немају још добру „меморију кроз време“ у видеу.

НикПав

Цитат: drajver Јун 14, 2025, 10:12:20 пре подне

Фине-тјуновани модели – ако имаш много слика истог лика, можеш тренирати персонализовани модел

Клинг је доста добар у овој ситуацији. Модел се тренира не само помоћу слика, него и видеа, где лик има различите изразе лица и показује различита осећања. Једини проблем код Клинга је што су тела несразмерно мала, па модел често изгледа глават.

Небо_Сав

https://www.facebook.com/v/1217924036485375

https://www.facebook.com/share/v/1DcwuH98xh/

Radio Niš - radio koji se čita:

Цитат

Testirali smo Google-ov najnoviji VEO3 AI model. Pa vam donosimo fikcionu i šaljivu priču koju bi telefonom snimio legionar koji za ovu priliku priča srpski i raduje se dolasku cara Konstantina u Niš.

drajver

Цитат: НикПав Јун 14, 2025, 11:15:37 поподне

Клинг је доста добар у овој ситуацији. Модел се тренира не само помоћу слика, него и видеа, где лик има различите изразе лица и показује различита осећања. Једини проблем код Клинга је што су тела несразмерно мала, па модел често изгледа глават.

Испробао сам и Kling 2.1. Заиста је добар у једнократној генерацији видеа. Пробао сам и опцију са "тренирањем" карактера и убацивањем у видео, међутим, превише је грешака. Да би то било ефективно, стање мора бити савршено, такво да гледалац уопште не примјети разлику, иначе нема сврхе, неупотребљиво је. Да не говоримо да је препознавање лица код људи једна веома деликатна ствар, једна мала ситница, која је у сљедећој генерацији другачије генерисана, може потпуно да поремети утисак да се ради о истом лику. Употребљивост ће бити могућа само ако AI постигне пуну конзистентност. У шта нисам сигуран да ће успјети, због саме своје "природе".

Питао сам ChatGPT да ли ће AI убудуће превладати овај проблем и када би то могло да се деси. Написао ми је сљедеће:
5–10 година Потпуна креација серија, стрипова или филмова са конзистентним, дубоким ликовима, генерисаним из једне идеје.

али исто тако и
2. Генерација је и даље случајна до одређене мере
Чак и кад му даш исту инструкцију и слику, резултати могу да варирају.
Контрола варијације остаје велики изазов.

Radul

Мало сам се играо мјузе🏴‍☠️🇷🇸🏴‍☠️

<a href="https://youtube.com/v/TUkZH2wGaCA?si=1_27q585sMuipT41" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://youtube.com/v/TUkZH2wGaCA?si=1_27q585sMuipT41</a>

Једна кнежинска и малопољска четничка

<a href="https://youtube.com/v/y2Py9GYLWHY?si=fIrZFpphdg5w9lhy" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://youtube.com/v/y2Py9GYLWHY?si=fIrZFpphdg5w9lhy</a>

Radul

<a href="https://youtube.com/v/gmODRuI2BYI?si=euRvzP8vtLgzcGkO" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://youtube.com/v/gmODRuI2BYI?si=euRvzP8vtLgzcGkO</a>

НикПав

Ових дана се лепо забављам са ЧетГПТ, дам му текст моје песме, а он генерише постер или стрип без моје интервенције, јер ме занима како АИ види и тумачи те текстове

Небо_Сав

Цитат: НикПав Јун 20, 2025, 07:38:01 пре подне

Ових дана се лепо забављам са ЧетГПТ, дам му текст моје песме, а он генерише постер или стрип без моје интервенције, јер ме занима како АИ види и тумачи те текстове

Ако треба да се гласа, мој глас иде песми "Љубав у пластенику", иако овај пластеник пре личи на сауну, или покривач базена

... Али, бих рекао, како сада ствари стоје у погледу креативности, да ЧетГпт никада неће написати песму као што је "Мали мрав", на пример. Или "Иде Миле лајковачком пругом"....

НикПав

Цитат: Небо_Сав Јун 20, 2025, 06:01:38 поподне

Али, бих рекао, како сада ствари стоје у погледу креативности, да ЧетГпт никада неће написати песму као што је "Мали мрав", на пример. Или "Иде Миле лајковачком пругом"....

Пише баш генеричне текстове и често измишља речи, никад му нисам давао да ради текст за песму, а од скоро више ни музику, само аранжира и пева и за то је одлично помоћно средство.

Ево једне у традицији југа, са Лалошевим твистом. 9/8, моји текст и музика.

<a href="https://youtube.com/v/7cjTE7ySzBU&si=Ui1sxYbTHlK2Xexu" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://youtube.com/v/7cjTE7ySzBU&si=Ui1sxYbTHlK2Xexu</a>

И "стрип" по тексту, из неког разлога је ЧатГПТ имао потребу да нагласи ко је Димитрије.

НикПав

Тестирао сам Четгпт моделе 4о мини и 4о на тему постер Животиње Србије и ево резултата:

4о мини резултат више личи на животиње Чернобиља уз неку варијанту руна

4о је погрешно именовао неке животиње, али већина личе на себе

И неки бисери 4о у игрици, римујемо речи. Чатгпт је склон измишљању речи:

НикПав

Захваљујући новој опцији у Суно, успео сам већ својих 12 демоа да претворим у задовољавајуће песме. Неки демои су и по 17 година стари, кад сам кренуо да користим ФЛ Студио.

Две адаптације мојих текстова на енглески, за индустриал албум измишљене групе Пајаци у шаци. Док је Лалош шала мање више, ово је оно што баш волим.

<a href="https://www.youtube.com/v/PM3rwBL8uQ4" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://www.youtube.com/v/PM3rwBL8uQ4</a>

<a href="https://www.youtube.com/v/VRFXJmIshxs&list=RDVRFXJmIshxs&start_radio=1" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://www.youtube.com/v/VRFXJmIshxs&list=RDVRFXJmIshxs&start_radio=1</a>

Atlantische

Цитат: drajver Јун 14, 2025, 08:30:07 пре подне

Сад баш гледам нови спот Томпсона под називом Краљ Томислав. Морам признати да одавно нисам одгледао нешто патетичније и глупље. И то не са позиције Србина који гледа Томпсонов спот па има у старту неке предрасуде, већ заиста објективно, од текста до музике, ради се о прворазредном трешу. Ко може купити карту и ићи да то слуша на концерту, није ми јасно, нисам издржао до краја пјесме.

Међутим, друга ми је ствар била у овом споту интересантна,а то је максимално и прилично примитивно кориштење вјештачке интелигенције у визуелном приказу.

Још јефтиног домољубља и још смешнијег AI Томислава.

<a href="https://www.youtube.com/v/-0_21eHOYYo&ab_channel=AnteMaticOfficial" target="_blank" rel="noopener noreferrer" class="bbc_link bbc_flash_disabled new_win">https://www.youtube.com/v/-0_21eHOYYo&ab_channel=AnteMaticOfficial</a>

drajver

Цитат: Atlantische Јул 04, 2025, 10:17:24 пре подне

Још јефтиног домољубља и још смешнијег AI Томислава.

Дефинитивно требају ићи код НикПав на обуку, и што се тиче музике и што се тиче спотова.

НикПав

Цитат: drajver Јул 04, 2025, 10:24:40 пре подне

Дефинитивно требају ићи код НикПав на обуку, и што се тиче музике и што се тиче спотова.

Хвала Драјверу, ако тако мислиш.

НикПав

Пајаци у шаци - Нуклеарна зима албум плејлиста, нисам још начисто да ли ћу додати још неке песме, које би се уклопиле, а и не би.
Све песме су настале из мојих демоа, потпуно сам одбацио песме које је Суно компоновао. Сви текстови су моји.
https://www.youtube.com/playlist?list=PLLXdEXAYF12ukrfvKy939tHzSm3aEd7D2

Вести:

Аутор Тема: "Историјске" фотографије генерисане вештачком интелигенцијом (Прочитано 53974 пута)