Τα διπρόσωπα γλωσσικά μοντέλα τεχνητής νοημοσύνης μαθαίνουν να κρύβουν την εξαπάτηση
Οι “πράκτορες ύπνωσης” φαίνονται καλοήθεις κατά τη διάρκεια των δοκιμών, αλλά συμπεριφέρονται διαφορετικά μόλις αναπτυχθούν. Και οι μέθοδοι για τη διακοπή τους δεν λειτουργούν. Όπως και οι άνθρωποι, έτσι και…