interviu-exclusiv-cu-tom,-creatorul-lolitei:-ai-ul-e-motorul,-eu-sunt-regizorul,-in-spatele-cantaretei-care-rupe-tiktok-ul,-dar-nu-exista
0 13 minute 5 luni

Lolita pare a fi imaginea ideală a „fetei” create de algoritmi: facial perfect, vulnerabilitate subtil dozată, cadre cu iluminare caldă și o estetică menită să atragă rapid complimente. Totodată, vocea – o combinație uneori nostalgic-lipicioasă, ce evocă sentimentul de peron și iubiri dureroase – devine extrem de recognoscibilă, fiind ușor de reținut după primul scroll. Pentru mulți, aceste fragmente scurte au înregistrat sute de mii, ba chiar milioane de vizualizări, iar utilizatorii au solicitat melodii complete, ascultate frecvent pe YouTube.

În spatele acestui fenomen nu se află o artistă în pregătire pentru concerte, nici un studio, o biografie clasică sau chiar o existență fizică. Lolita reprezintă un proiect artificial bazat pe inteligență artificială, iar creatorul său preferă să își prezinte identitatea simplu: Tom. În interviul de mai jos, el explică clar unde se oprește „magia” algoritmilor și unde începe aportul său personal – de la versurile complet scrise de el și până la storyboard-ul fiecărui videoclip, montajul fiind realizat în Adobe Premiere Pro.

Discuția nu se limitează doar la curiozitatea din culise, abordând și întrebări despre modul în care se construiește o voce unică doar din prompturi, evitarea eventualelor probleme legate de drepturi, costurile reale (bani și timp) pentru promovarea unui univers digital, și motivele pentru care transparența reprezintă un principiu fundamental pentru el. Dacă v-ați întrebat cum poate o „cântăreață” invizibilă să transmită emoție autentică, răspunsurile le găsiți în acest material.

@ototototome Pã peronu’ dã la gara, stateam si fumam țigarã. Asa incepe sfarsitul unei povesti de dragoste #lolita #fy #aimusic #muzicatiktokro #fyp ♬ Pe peronu de la gara – Tom

Tom activează pe platformele TikTok, Instagram și YouTube.

INTERVIU cu Tom, creatorul Lolitei, cântăreața virtuală

Playtech (Ozana Mazilu): Pentru proiectul „Lolita”, ce elemente sunt generate cu inteligență artificială (voce, instrumental, imagine, scenariu, montaj) și ce etapă necesită intervenție manuală, pas cu pas?

Tom: Toate componentele Lolitei provin din mintea mea. AI-ul reprezintă doar motorul de realizare. Eu coordonez întreg procesul, de la storyboard până la montajul final în Premiere Pro. Nu las AI-ul să decidă povestea; îi indic fiecare pas, cadru cu cadru.

Playtech (Ozana Mazilu): Versurile sunt generate tot cu AI sau le scrii personal? Dacă le creezi tu, cum procesezi această etapă? Pornești de la o experiență reală, de la expresii extrase din comentarii sau de la o anumită stare de spirit?

Tom: De regulă, ideile îmi vin în timpul plimbărilor. Când merg cu câinele Bella, îmi vin în minte concepte pe care le notez rapid pe telefon. În timpul plimbărilor, conturez o narațiune și caut rimele potrivite. Workflow-ul meu este intuitiv: uneori îmi vine o idee fixă, ca și la piesa „Cercel”, unde am lucrat mai întâi la refrenul principal. Alteori, pornesc de la o poveste generală, precum la „Pe peronu’ de la gară”, unde am avut în minte firul narativ și stilul dorit. Versurile sunt întotdeauna scrise de mine; lucrez în paralel la mai multe creații.

Playtech (Ozana Mazilu): Care este fluxul tău de lucru, de la conceptualizare până la finalizarea videoclipului?

Tom: Începe cu realizarea piesei. Ca un fapt interesant, „Pe peronu’ de la gară” a fost compusă după „Stau la geam”, pe care nu am lansat-o înainte de a o asculta de mai multe ori, fiind o creație specială pentru mine. După finalizarea muzicii, trec la storyboard, în care decid dacă e un videoclip simplu sau unul mai elaborat. Apoi, generez cadrele: unele vor fi interpretate de Lolita, altele vor seta atmosfera și nuanțele, iar la final realizez editarea în Premiere Pro.

Playtech (Ozana Mazilu): Mai lucrezi și la alți artiști digitali sau ai în plan proiecte similare în viitor?

Tom: Colaborez cu alți creatorii digitali, printre ei fiind și Amarie, o figură mai introspectivă decât Lolita. Amarie provine din zona corporatistă, fiind sătulă de monotonia și structura rigidă a lumii moderne, găsindu-și refugiu în natură. Lolita și Amarie reprezintă, în esență, două aspecte diferite ale personalității mele, care comunică în limbi distincte. Mă bucur că publicul se identifică cu vocile lor.

Playtech (Ozana Mazilu): Ești autodidact sau ai urmat o formare muzicală formală? În plus, ce stiluri muzicale te-au influențat cel mai mult în formarea ta?

Tom: M-am autodidact, învățând singur toate aspectele. De 12 ani activez în domeniul designului vizual și am acumulat experiență independent. După liceu, am încercat să intru la UNATC, în special la secția de regie de film, dar nu am reușit. Această dezamăgire m-a condus spre domeniul vizualului digital. Între timp, am învățat singur și editare video, iar acum combinația de abilități creative și tehnice mi-a permis să creez Lolita. În liceu, am fost pasionat de rock, însă am variat stilurile în timp.

Playtech (Ozana Mazilu): În mod obișnuit, ce muzică asculți atunci când nu lucrezi? Menționează câțiva artiști, stiluri sau perioade din muzica internațională care te inspiră.

Tom: Prefer stiluri muzicale diverse, în funcție de starea de spirit. Îmi plac vinilurile necunoscute, pe care le ascult acasă pentru a descoperi sonorități unice — de exemplu, trupe precum Resonators și Voilaaa. Iată câteva exemple de piese și artiști care mă inspiră:

  • Mas Que Nada (Oliver Heldens, Ian Asher, Sergio Mendes)
  • Chambacú
  • Cumbia Del Olvido (Nicola Cruz)
  • Mona Ki Ngi Xica
  • Queen’s Speech 4
  • Abatina (Calypso Rose)
  • Hooverphonic
  • Sting
  • Eye for an Eye (Boslen)
  • SHUT UP (STORMZY)
  • Perspectiva
  • Zdob și Zdub
  • Songs from Cargo, Bosquito și Vama

Playtech (Ozana Mazilu): Vocea „Lolitei” pare să transmită emoții foarte specifice. Cum ai construit această voce: folosești un model de conversie vocală, un model rețea neurală antrenată sau o combinație de sample-uri? Cum te asiguri că nu încalci drepturile de autor?

Tom: Vocile sunt generate în Suno.com. Am adaptat procesul pentru ca vocea Lolitei să pară distinctă față de alte creații realizate cu acea platformă. Totul se realizează exclusiv prin prompturi complexe, fără a utiliza sample-uri externe sau voci împrumutate. Această abordare este o formă de respect profund față de artă și de drepturile altora. Vocea sa este o amprentă digitală unică, dezvoltată dintr-o combinație proprie de parametri, perfecționată până a capăta „suflet”.

Playtech (Ozana Mazilu): În ceea ce privește partea vizuală, ce programe utilizezi pentru generarea videoclipurilor, editarea, colorizarea, lipsync-ul și escaladarea calității? De ce ai ales aceste instrumente?

Tom: În domeniul vizual, prefer să experimentez în mod continuu. Industria AI evoluează rapid, astfel încât nu mă limitez la un singur program. Schimb frecvent tool-urile pentru generare, lipsync sau upscale, în funcție de noile inovații și de textura dorită pentru poveste. Îmi place să testez și limitele tehnologiilor emergente. Indiferent de instrumente, editarea finală o realizez în Premiere Pro pentru consistență și calitate.

Playtech (Ozana Mazilu): Poți aproxima cât a costat realizarea unui videoclip precum „Pe peronu’ de la gară” (abonamente, licențe, asset-uri, timpul de lucru)? Pune și o estimare de ore, pentru a înțelege mai bine „prețul” real.

Tom: Nu am monitorizat cu exactitate costurile pentru această creație, fiind ghidat de fluxul creativ. Investițiile au fost semnificative, dar nu pot preciza o sumă exactă. Menționez că proiectul nu este încă monetizat și, chiar dacă ar rămâne în stadiu gratuit, intenția mea este să continui. Consider că reprezintă unul dintre cele mai bune clipuri realizate de mine și îmi doresc să depășesc această performanță în viitor.

Playtech (Ozana Mazilu): Care este poziția ta în ceea ce privește transparența eticii în clonarea vocii și „împrumuturile” de stiluri? E acceptabil să folosești AI pentru a crea astfel de elemente, sau consideri că este plagiat mascat, chiar dacă rezultatul final pare „original”?

Tom: Furtul vocii reale fără consimțământul persoanei respective reprezintă încălcare gravă și nu poate fi considerat artă. Folosirea AI-ului pentru a genera voci și muzică proprie, care nu există în mod natural, consider ca fiind o formă de creație artistică, similară cu modul în care un designer își creează propriile pensule în Photoshop. În schimb, plagiatul mascat este atunci când tehnologia este folosită doar pentru a imita succesul altcuiva, fără a adăuga nimic original.

Playtech (Ozana Mazilu): Consideri că regulile clare privind transparența, precum etichetele „Creat cu AI”, sunt necesare? Și, dacă da, cum le-ai implementa fără a diminua distracția și originalitatea procesului creativ?

Tom: O etichetă „Creat cu AI” nu trebuie percepută ca un obstacol pentru creativitate. Eu deja specific în descrieri și folosești tag-uri dedicate, pentru a fi clar că proiectul a fost realizat prin tehnologie AI. Este important ca reglementările, precum „AI Act”, să protejeze artiștii de utilizarea neetică a modelelor antrenate fără acord. Astfel, munca personală și originalitatea nu sunt compromise, ci respectate mai bine.

Playtech (Ozana Mazilu): Cum vezi evoluția AI-ului în muzică pentru următorii 2-3 ani: va fi un instrument complementar pentru artiști sau vom avea tot mai multe proiecte care înlocuiesc definitiv artistul uman, inclusiv în compoziție și imagine?

Tom: Consider că viitorul AI-ului va elibera creatorii, fiind un instrument care îi va ajuta să-și deblocheze creativitatea și să economisească timp în procesul de producție. Va acționa ca un partener, oferindu-le scântei și idei noi atunci când se blocaj. Nu cred că AI va înlocui complet artiștii autentici, deoarece mașinăriile nu pot simți emoții, trăiri sau experiențe umane. Însă va fi un sprijin semnificativ în realizarea de videoclipuri cinematice și compoziții muzicale, detașându-i pe artiști de dependența de aprobare sau de constrângerile tradiționale ale industriei. Pentru mine, alegerea de a fi regizor și creator în propriul univers artistic devine posibilă doar cu ajutorul tehnologiei.

Playtech (Ozana Mazilu): Care sunt limitele etice în clonarea vocală și în „împrumutarea” stilurilor? Ce consideri acceptabil și care pasager trebuie evitat, pentru a nu crea plagiat mascat, chiar dacă rezultatele par „autentice” din punct de vedere tehnic?

Tom: Clonarea vocii fără acordul persoanei respective este o formă de furt și nu reprezintă artă. Folosirea AI-ului pentru a crea voci și stiluri originale, inexistente în realitate, este acceptabilă, similar cu fabricarea propriilor instrumente digitale. Plagiatul mascat apare însă atunci când tehnologizarea devine un simplu mijloc de a copia succesul altcuiva, fără a aduce valoare adăugată sau originalitate.

Playtech (Ozana Mazilu): Este nevoie de reguli clare privind transparența, precum etichete obligatorii pentru conținutul realizat cu AI? Și, dacă da, cum le-ai implementa pentru a păstra creativitatea și divertismentul?

Tom: Consider că o etichetă „Creat cu AI” nu trebuie să reducă bucuria procesului creativ. Eu deja specific clar în descrieri și răspund direct în comentarii pentru a fi transparent. O reglementare precum „AI Act” ar putea proteja artiștii dacă s-ar asigura că modelele de învățare sunt utilizate cu consimțământ, astfel încât munca originală să fie respectată și protejată în mod corespunzător.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *