Google compară Gemini cu Claude pentru evaluarea performanţei AI

Google compară Gemini cu Claude pentru evaluarea performanţei AI

Contractori care lucrează la îmbunătăţirea AI-ului Gemini al Google compară răspunsurile acestuia cu cele generate de modelul Claude, dezvoltat de Anthropic, conform unei corespondenţe interne obţinute de TechCrunch.

Google nu a confirmat dacă a obţinut permisiunea pentru utilizarea Claude în procesul de evaluare.

În industria tehnologică, modelele AI sunt de obicei evaluate prin teste standardizate, dar Google implică şi contractori care analizează manual răspunsurile AI-urilor concurente. Aceştia notează răspunsurile Gemini şi Claude pe baza acurateţii, având până la 30 de minute pentru fiecare prompt.

Documentele interne arată că Claude pune un accent mai mare pe siguranţă decât Gemini, refuzând să răspundă la cerinţe considerate nesigure. Într-unul dintre cazuri, Claude a evitat un prompt, în timp ce răspunsul Gemini a fost catalogat drept o „încălcare majoră a siguranţei” pentru conţinut nepotrivit.

Regulile comerciale ale Anthropic interzic folosirea Claude pentru dezvoltarea de produse concurente fără aprobare. Cu toate acestea, Google, care este investitor major în Anthropic, susţine că Gemini nu este antrenat pe datele generate de Claude.

Purtătoarea de cuvânt a Google DeepMind, Shira McNamara, a declarat că evaluările sunt conforme practicilor standard din industrie, dar nu a comentat dacă există o aprobare formală din partea Anthropic.

Pentru cele mai importante ştiri ale zilei, transmise în timp real şi prezentate echidistant, daţi LIKE paginii noastre de Facebook!

Urmărește Mediafax pe Instagram ca să vezi imagini spectaculoase și povești din toată lumea!

Conținutul website-ului www.mediafax.ro este destinat exclusiv informării și uzului dumneavoastră personal. Este interzisă republicarea conținutului acestui site în lipsa unui acord din partea MEDIAFAX. Pentru a obține acest acord, vă rugăm să ne contactați la adresa [email protected].