Το ρομπότ AI της Google χρησιμοποιεί μοντέλα γλώσσας για να γράψει κώδικα

Η σύνταξη κώδικα εργασίας μπορεί να είναι μια πρόκληση. Ακόμη και σχετικά απλές γλώσσες όπως η HTML απαιτούν από τον κωδικοποιητή να κατανοήσει τη συγκεκριμένη σύνταξη και τα διαθέσιμα εργαλεία. Η σύνταξη κώδικα για τον έλεγχο των ρομπότ περιλαμβάνεται ακόμη περισσότερο και συχνά έχει πολλά βήματα: Υπάρχει κώδικας για την ανίχνευση αντικειμένων, κώδικας για την ενεργοποίηση των ενεργοποιητών που κινούν τα άκρα του ρομπότ, κώδικας για τον καθορισμό πότε ολοκληρώνεται η εργασία και ούτω καθεξής. Κάτι τόσο απλό όσο ο προγραμματισμός ενός ρομπότ ώστε να παίρνει ένα κίτρινο μπλοκ αντί για ένα κόκκινο είναι αδύνατο αν δεν γνωρίζετε τη γλώσσα κωδικοποίησης στην οποία εκτελείται το ρομπότ.

Αλλά οι ερευνητές ρομποτικής της Google διερευνούν έναν τρόπο να το διορθώσουν. Έχουν αναπτύξει ένα ρομπότ που μπορεί να γράψει τον δικό του κώδικα προγραμματισμού με βάση οδηγίες φυσικής γλώσσας. Αντί να χρειάζεται να βουτήξετε στα αρχεία διαμόρφωσης ενός ρομπότ για να αλλάξετε το χρώμα_στόχου_μπλοκ από #FF0000 σε #FFFF00, θα μπορούσατε απλώς να πληκτρολογήσετε “σηκώστε το κίτρινο μπλοκ” και το ρομπότ θα έκανε τα υπόλοιπα.

Το Code as Policies (ή CaP για συντομία) είναι ένα μοντέλο γλώσσας για συγκεκριμένο κώδικα που αναπτύχθηκε από το Pathways Language Model (PaLM) της Google για να ερμηνεύσει τις οδηγίες φυσικής γλώσσας και να τις μετατρέψει σε εκτελέσιμο κώδικα. Οι ερευνητές της Google εκπαίδευσαν το μοντέλο δίνοντάς του παραδείγματα οδηγιών (μορφοποιημένα ως σχόλια κώδικα που γράφτηκαν από τους προγραμματιστές για να εξηγήσουν τι κάνει ο κώδικας σε όποιον τον αξιολογήσει) και τον αντίστοιχο κώδικα. Από εκεί, μπόρεσε να λάβει νέες οδηγίες και να «δημιουργήσει αυτόνομα νέο κώδικα που συνθέτει εκ νέου κλήσεις API, συνθέτει νέες λειτουργίες και εκφράζει βρόχους ανατροφοδότησης για τη συγκέντρωση νέων συμπεριφορών κατά την εκτέλεση», εξήγησαν οι μηχανικοί της Google σε μια ανάρτηση ιστολογίου που δημοσιεύτηκε αυτήν την εβδομάδα. , Με άλλα λόγια, εάν δοθεί ένα μήνυμα που μοιάζει με σχόλιο, μπορεί να βρει έναν πιθανό κωδικό bot. Διαβάστε την προέκδοση της δουλειάς τους εδώ.

Google AI

Για να πείσει το CaP να γράψει νέο κώδικα για συγκεκριμένες εργασίες, η ομάδα του παρείχε “συμβουλές”, όπως ποια API ή εργαλεία ήταν διαθέσιμα σε αυτό και μερικές οδηγίες για την κωδικοποίηση συνδεδεμένων παραδειγμάτων. Από εκεί μπόρεσε να γράψει νέο κώδικα για νέες οδηγίες. Το κάνει αυτό χρησιμοποιώντας την “δημιουργία ιεραρχικού κώδικα” που του ζητά να “καθορίσει αναδρομικά νέες συναρτήσεις, να συσσωρεύσει τις δικές του βιβλιοθήκες με την πάροδο του χρόνου και να σχεδιάσει μόνος του μια δυναμική βάση κώδικα.” Αυτό σημαίνει ότι με δεδομένο ένα σύνολο εντολών μία φορά, μπορεί να αναπτύξει κάποιο κώδικα τον οποίο μπορεί στη συνέχεια να επαναχρησιμοποιήσει για παρόμοιες οδηγίες αργότερα.

[Related: Google’s AI has a long way to go before writing the next great novel]

Το CaP μπορεί επίσης να εφαρμόσει αριθμητικές πράξεις και λογική σε συγκεκριμένες γλώσσες. Για παράδειγμα, ένα μοντέλο που έχει εκπαιδευτεί σε Python μπορεί να χρησιμοποιήσει κατάλληλους βρόχους if/else και for/while όταν είναι απαραίτητο και να χρησιμοποιήσει βιβλιοθήκες τρίτων για πρόσθετη λειτουργικότητα. Μπορεί επίσης να μετατρέψει διφορούμενες περιγραφές όπως “γρήγορες” και “αριστερά” στις ακριβείς αριθμητικές τιμές που είναι απαραίτητες για την εκτέλεση της εργασίας. Και επειδή το CaP είναι χτισμένο πάνω σε ένα μοντέλο κανονικής γλώσσας, έχει μερικά χαρακτηριστικά που δεν σχετίζονται με τον κώδικα, όπως η κατανόηση emoji και μη αγγλικών γλωσσών.

Προς το παρόν, η CaP εξακολουθεί να είναι πολύ περιορισμένη σε ό,τι μπορεί να κάνει. Βασίζεται στο γλωσσικό μοντέλο στο οποίο βασίζεται για να παρέχει το πλαίσιο στις οδηγίες. Αν δεν έχουν νόημα ή χρησιμοποιούν παραμέτρους δεν υποστηρίζει, δεν μπορεί να γράψει κώδικα. Ομοίως, προφανώς μπορεί να διαχειριστεί μόνο μια χούφτα παραμέτρων σε μία γραμμή εντολών. πιο περίπλοκες ακολουθίες ενεργειών που απαιτούν δεκάδες παραμέτρους απλά δεν είναι δυνατές. Υπάρχουν επίσης ανησυχίες για την ασφάλεια: ο προγραμματισμός ενός ρομπότ για να γράψει τον δικό του κώδικα μοιάζει λίγο με το Skynet. Αν πιστεύει ότι ο καλύτερος τρόπος για να κάνει μια εργασία είναι να περιστρέφεται πολύ γρήγορα με το χέρι του τεντωμένο και υπάρχει ένας άνθρωπος κοντά, κάποιος μπορεί να τραυματιστεί.

Ωστόσο, είναι απίστευτα συναρπαστική έρευνα. Με τα ρομπότ, ένα από τα πιο δύσκολα καθήκοντα είναι η γενίκευση της εκπαιδευμένης συμπεριφοράς τους. Ο προγραμματισμός ενός ρομπότ για να παίξει πινγκ-πονγκ δεν το καθιστά ικανό να παίξει άλλα παιχνίδια όπως μπέιζμπολ ή τένις. Παρόλο που το CaP απέχει ακόμη μίλια από τέτοιες ευρείες εφαρμογές του πραγματικού κόσμου, επιτρέπει σε ένα ρομπότ να εκτελεί ένα ευρύ φάσμα σύνθετων ρομποτικών εργασιών χωρίς εκπαίδευση για συγκεκριμένες εργασίες. Είναι ένα μεγάλο βήμα για να μπορέσουμε μια μέρα να διδάξουμε ένα ρομπότ που μπορεί να παίξει ένα παιχνίδι για να παίξει ένα άλλο – χωρίς να χρειάζεται να αναλύσει τα πάντα σε νέο κώδικα που έχει γραφτεί από τον άνθρωπο.

Leave a Comment