Napravili su AI koji je toliko moćan da ga ne smiju objaviti
Anthropic je razvio novi model pod internim imenom Claude Mythos - i odlučio da ga ne pusti u javnost. Ne zato što nije dobar, nego zato što je previše dobar.
Konkretni rezultati:
• Na SWE-bench Pro testu: skok sa 53,4% na 77,8%
• Na Terminal-Bench 2.0: sa 65,4% na 82%
• Firefox exploit generacija: Claude Opus je pronašao 2 ranjivosti iz stotina pokušaja. Mythos ih je pronašao 181.
• Otkrio bugove stare 27 godina u OpenBSD-u i 16 godina u FFmpeg-u - softverima koji pokreću kritičnu infrastrukturu širom svijeta.
Umjesto javnog izdavanja, Anthropic je pokrenuo Project Glasswing - kontrolisani program u koji je uključeno samo 12 odabranih kompanija. Uloženo je 100 miliona dolara u model usage kredite i 4 miliona dolara u donacije za open-source sigurnosne organizacije.
Dakle, postoji AI koji bi vjerovatno promijenio pravila igre u cybersecurity svijetu. I namjerno se ne objavljuje.
Šta mislite, da li je ovo prava odluka, ili je transparentnost važnija od opreznosti?
1 Odgovor
Razumijem taj stav, pogotovo kad vidimo ovakve rezultate. Ali pitanje nije samo da li smo spremni, nego i kako se pripremamo. Ograničeno testiranje u kontrolisanim uslovima može biti način da se rizici razumiju prije nego što tehnologija postane široko dostupna.