Η Google παρουσιάζει το MusicLM, το οποίο είναι ένα νέο εργαλείο τεχνητής νοημοσύνης που παράγει μουσική υψηλής ποιότητας από περιγραφές κειμένου. Μπορεί να κατανοήσει φράσεις όπως «μια ήρεμη μελωδία βιολιού που υποστηρίζεται από ένα παραμορφωμένο riff κιθάρας» και να τις μετατρέψει σε αντίστοιχες μουσικές συνθέσεις.
Αυτή είναι μια σημαντική πρόοδος στη μουσική που δημιουργείται από την τεχνητή νοημοσύνη και θα μπορούσε να επηρεάσει σε μεγάλο βαθμό τον τρόπο που δημιουργείται και καταναλώνεται μουσική.
MusicLM: Generating Music From Text
Το εργαλείο είναι φιλικό προς το χρήστη και εύκολο στη χρήση, καθιστώντας το προσβάσιμο σε ένα ευρύ φάσμα χρηστών. Χρησιμοποιεί μια ιεραρχική προσέγγιση μοντελοποίησης ακολουθίας σε ακολουθία για τη δημιουργία μουσικής στα 24 kHz, η οποία παραμένει σταθερή για αρκετά λεπτά.
Τα πειράματα δείχνουν ότι το MusicLM ξεπερνά τα προηγούμενα συστήματα όσον αφορά την ποιότητα ήχου και την τήρηση της περιγραφής του κειμένου. Μπορεί επίσης να λάβει και κείμενο και μια υπάρχουσα μελωδία ως είσοδο, επιτρέποντάς του να μεταμορφώσει τις μελωδίες που σφυρίζουν και βουίζουν σύμφωνα με το στυλ που περιγράφεται σε μια λεζάντα κειμένου. Για να υποστηρίξουν τη μελλοντική έρευνα, οι προγραμματιστές κυκλοφόρησαν δημόσια το MusicCaps, ένα σύνολο δεδομένων 5,5 χιλιάδων ζευγών μουσικής-κειμένου, με περιγραφές πλούσιου κειμένου που παρέχονται από ειδικούς σε ανθρώπους.
Επιπλέον, το MusicLM μπορεί να ανιχνεύσει διάφορα Επίπεδα Εμπειρίας Μουσικών, Μέρη, Εποχές, Σόλο Ακορντεόν και Ποικιλομορφία Γενεών, διατηρώντας παράλληλα σταθερά τη ρύθμιση και/ή τα σημασιολογικά διακριτικά, το ίδιο μήνυμα κειμένου και τα ίδια σημασιολογικά διακριτικά και πολλά άλλα.