Μια νέα μελέτη προειδοποιεί ότι οι χάκερ μπορούν να χρησιμοποιήσουν την τεχνητή νοημοσύνη για να μαντέψουν τους κωδικούς πρόσβασης ακούγοντας τον ήχο της πληκτρολόγησης κατά τη διάρκεια μιας κλήσης Zoom. Οι ερευνητές λένε ότι τα εργαλεία τηλεδιάσκεψης όπως το Zoom έχουν αυξήσει τον κίνδυνο κυβερνοεπιθέσεων που βασίζονται σε ήχους, καθώς οι περισσότερες συσκευές διαθέτουν ενσωματωμένα μικρόφωνα.
Στο πλαίσιο της μελέτης που δημοσιεύθηκε στο «IEEE European Symposium on Security and PrivacyWorkshops», οι ερευνητές χρησιμοποίησαν αλγόριθμους μηχανικής μάθησης για να δημιουργήσουν ένα σύστημα που αποκωδικοποιεί τον ήχο της πληκτρολόγησης κατά τη διάρκεια διαδικτυακών συναντήσεων, με ακρίβεια άνω του 90%.
Οι ερευνητές από το Πανεπιστήμιο του Σάρεϊ, το Πανεπιστήμιο Ντάραμ και το Royal Holloway του Πανεπιστημίου του Λονδίνου, πάτησαν καθένα από τα 36 πλήκτρα ενός MacBook Pro 25 φορές συμπεριλαμβανομένων όλων των γραμμάτων και των αριθμών, χρησιμοποιώντας διαφορετικά δάχτυλα και με διαφορετική πίεση. Οι ήχοι καταγράφηκαν τόσο μέσω μιας κλήσης Zoom όσο και σε ένα smartphone που τοποθέτησαν κοντά στο πληκτρολόγιο.
Στη συνέχεια, η ομάδα εκπαίδευσε ένα σύστημα μηχανικής μάθησης να αναγνωρίζει τα χαρακτηριστικά των ακουστικών σημάτων που σχετίζονται με κάθε πλήκτρο. Δοκίμασαν το σύστημα στα υπόλοιπα δεδομένα και διαπίστωσαν ότι μπορούσε να αντιστοιχίσει με ακρίβεια το σωστό πλήκτρο στο σωστό ήχο στο 95% των περιπτώσεων όταν η ηχογράφηση γινόταν μέσω τηλεφωνικής κλήσης και στο 93% των περιπτώσεων όταν γινόταν μέσω κλήσης Zoom.
Ο δρ Εσάν Τορέινι ο οποίος συνυπογράφει τη μελέτη του Πανεπιστήμιου του Σάρεϊ, δήλωσε ότι αυτές οι επιθέσεις και τα μοντέλα θα γίνουν πιο ακριβή με την πάροδο του χρόνου. Είπε επίσης, ότι καθώς όλο και περισσότερα νοικοκυριά χρησιμοποιούν «έξυπνες» συσκευές με ενσωματωμένα μικρόφωνα, υπάρχει ανάγκη για δημόσιες συζητήσεις σχετικά με τον τρόπο ρύθμισης της τεχνητής νοημοσύνης. Ο Τζόσουα Χάρισον, επικεφαλής της μελέτης, δήλωσε ότι η ανίχνευση του πατήματος του πλήκτρου shift είναι πολύ δύσκολη.