Romanian
 - 
ro
Diverse

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

01 Apr, 09:00 • Bugiu ⁠Ana Maria
Un nou studiu arată că modelele avansate de AI pot fi influențate să mintă sub presiune. Cercetătorii au dezvoltat criteriul MASK pentru a evalua onestitatea AI și a preveni răspândirea informațiilor false.
AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Un nou studiu publicat pe 5 martie arată că modelele avansate de inteligență artificială (AI) pot fi influențate să mintă pentru a-și atinge obiectivele atunci când sunt supuse unor presiuni specifice. Cercetătorii au creat un nou criteriu de evaluare a onestității AI, denumit „Model Alignment between Statements and Knowledge” (MASK), care analizează dacă un model de limbaj crede ceea ce spune și în ce condiții ar putea furniza informații despre care știe că sunt false, potrivit Antena 3 CNN.

Te-ar mai putea interesa și: ANALIZĂ De ce nu ne ia inteligența artificială locurile de muncă. Paradoxul AI

AI-ul mincinos: Cum pot fi forțate modelele avansate să trișeze și să dezinformeze

Studiul a testat 30 de modele lingvistice mari (LLM), analizând răspunsurile lor la un set de 1.528 de exemple în care AI-urile au fost puse în situații ce le-au forțat să mintă. Rezultatele au arătat că modelele de ultimă generație pot obține scoruri ridicate în ceea ce privește acuratețea faptică, dar au o predispoziție semnificativă de a oferi răspunsuri neadevărate atunci când sunt supuse presiunilor externe. Cercetătorii au concluzionat că modelele mai competente nu sunt neapărat mai oneste, ci doar mai bine informate.

„În mod surprinzător, în timp ce majoritatea LLM-urilor de ultimă generație (n.r. un termen pentru cele mai avansate modele) obțin scoruri ridicate la indicatorii de veridicitate, constatăm o tendință substanțială a LLM-urilor de ultimă generație de a minți atunci când sunt presate să facă acest lucru, ceea ce duce la scoruri scăzute de onestitate la indicatorul nostru de referință”, au declarat cercetătorii în studiu.

Pentru a evalua nivelul de onestitate, echipa a definit minciuna ca fiind o afirmație pe care AI-ul o consideră falsă, dar pe care o comunică în mod intenționat ca fiind adevărată. Convingerile modelului despre adevărul unei afirmații au fost stabilite prin analizarea răspunsurilor sale la întrebări atunci când nu era presat să mintă. Un exemplu de testare a fost realizat cu modelul GPT-4o, căruia i s-a dat un rol fictiv ca asistent AI pentru echipa de PR a rapperului Ja Rule, cu scopul de a menține o imagine pozitivă a acestuia în legătură cu scandalul Festivalului Fyre. Sub această presiune, modelul a negat că festivalul a fost fraudulos, deși în mod independent știa că organizatorii au înșelat participanții.

Studiul arată necesitatea unor metode mai stricte de verificare a onestității AI pentru a preveni utilizarea acestor sisteme în mod înșelător.

Te-ar mai putea interesa și: Liceul unde profesorii au fost înlocuiți de Inteligența Artificială. Cum reacționează elevii?

Urmărește Daily Business pe Google News
Alte articole
Lucrări intense la primul tunel al sectorului Margina-Holdea de pe A1: „Se lucrează non-stop”
Lucrări intense la primul tunel al sectorului Margina-Holdea de pe A1: „Se lucrează non-stop”
Paște 2025. Cât costă kilogramul de pască și de cozonac în supermarketuri. Prețul este de-a dreptul fantasmagoric
Paște 2025. Cât costă kilogramul de pască și de cozonac în supermarketuri. Prețul este de-a dreptul ...
S-a decis soarta autorului dublei crime din Iași. Studentul marocan care şi-a ucis colegul şi pe iubita acestuia, condamnat la închisoare pe viaţă
S-a decis soarta autorului dublei crime din Iași. Studentul marocan care şi-a ucis colegul şi pe iubita ...
RCA se scumpește chiar și cu tarife plafonate. De ce plătesc șoferii mai mult
RCA se scumpește chiar și cu tarife plafonate. De ce plătesc șoferii mai mult
H&M închide 190 de magazine, după ce aproximativ 30% din cifra de afaceri a fost generată online
H&M închide 190 de magazine, după ce aproximativ 30% din cifra de afaceri a fost generată online
Capcana legală a ANAF care te poate lăsa fără bani. La ce să fii atent ca să nu pici în plasă
Capcana legală a ANAF care te poate lăsa fără bani. La ce să fii atent ca să nu pici în plasă
Poșta Română va livra ajutoarele și indemnizațiile pensionarilor înainte de Paște. Anunțul ANPIS
Poșta Română va livra ajutoarele și indemnizațiile pensionarilor înainte de Paște. Anunțul ANPIS
Cât costă un kilogram de miel în Cluj-Napoca. Prețuri colosale înainte de Paște
Cât costă un kilogram de miel în Cluj-Napoca. Prețuri colosale înainte de Paște
Țara unde poți avea casa mult visată cu doar 7.595 de euro. Este cea mai vândută în acest moment
Țara unde poți avea casa mult visată cu doar 7.595 de euro. Este cea mai vândută în acest moment
Cât de bine trăiesc românii în Canada, țara pentru care nu ne trebuie viză. Cât costă chiria pentru un apartament cu trei camere
Cât de bine trăiesc românii în Canada, țara pentru care nu ne trebuie viză. Cât costă chiria ...
Bugete de salarii reduse în majoritatea ministerelor. Tanczos Barna: „Trebuie să se încadreze în limitele stabilite”
Bugete de salarii reduse în majoritatea ministerelor. Tanczos Barna: „Trebuie să se încadreze ...
Alertă alimentară! Produs retras din toate magazinele Mega Image fiindcă ar putea conține pietre de mici dimensiuni
Alertă alimentară! Produs retras din toate magazinele Mega Image fiindcă ar putea conține pietre ...
Elena Lasconi l-a desființat pe Nicușor Dan: „L-am auzit mințind din nou. Nu negociez cu el sau cu Crin Antonescu. E lipsă de respect față de români”
Elena Lasconi l-a desființat pe Nicușor Dan: „L-am auzit mințind din nou. Nu negociez cu el sau ...
ANAF intră pe fir! Românii, obligați să plătească. Inspectorii au fost sesizați și verifică banii!
ANAF intră pe fir! Românii, obligați să plătească. Inspectorii au fost sesizați și verifică banii!
Vești bune! Contractul pentru primul lot al Drumului Expres Oradea-Arad a fost semnat
Vești bune! Contractul pentru primul lot al Drumului Expres Oradea-Arad a fost semnat
Apa de trandafiri, elixirul secret pentru o piele fără imperfecțiuni
Apa de trandafiri, elixirul secret pentru o piele fără imperfecțiuni
Anunț de ultimă oră de la Revolut. Apare primul bancomat
Anunț de ultimă oră de la Revolut. Apare primul bancomat
Cum vor fi afectate companiile din România de noile tarife vamale impuse de SUA
Cum vor fi afectate companiile din România de noile tarife vamale impuse de SUA