Το Mozilla «συλλέγει» φωνές για να φτιάξει νέο πρόγραμμα αναγνώρισης ομιλίας

Το Mozilla «συλλέγει» φωνές για να φτιάξει νέο πρόγραμμα αναγνώρισης ομιλίας

Το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπου - Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική

Ο καθένας μπορεί εδώ και λίγες μέρες να «κατεβάσει» στον υπολογιστή του εκατοντάδες χιλιάδες δείγματα φωνής που έχει ήδη συλλέξει το Ίδρυμα Mozilla στο πλαίσιο του νέου έργου του Common Voice.

Πρόκειται για ένα σύστημα αναγνώρισης ομιλίας ανοιχτού κώδικα, το οποίο βασίζεται σε εθελοντές που υποβάλλουν δείγματα της ομιλίας τους. Στόχος του Mozilla είναι, μέσα από τη συλλογή των δειγμάτων αυτών, να εκπαιδεύσει μια νέα εφαρμογή ανοιχτού κώδικα για την αναγνώριση της ομιλίας.

Η συλλογή δειγμάτων φωνής ξεκίνησε πριν λίγους μήνες και μέχρι σήμερα το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπους, συνολικά περίπου 500 ώρες ομιλίας.

Διάφορα συστήματα τεχνητής νοημοσύνης, όπως της Google, εκπαιδεύονται στην αναγνώριση ομιλίας χρησιμοποιώντας δεδομένα των χρηστών. Στην περίπτωση του Mozilla (δημιουργού, μεταξύ άλλων, του δημοφιλούς προγράμματος διαδικτυακής περιήγησης Firefox), ο μηχανισμός αναγνώρισης της ομιλίας είναι ανοιχτός κώδικας, κάτι που θα επιτρέψει την επαναχρησιμοποίηση αυτής της τεχνολογίας.

Έως πρόσφατα, οι προγραμματιστές, επιχειρήσεις και ερευνητές που ήθελαν να πειραματιστούν και να αναπτύξουν νέες τεχνολογίες φωνής, είχαν πρόσβαση σε μια περιορισμένη συλλογή δεδομένων φωνής. Η συλλογή Common Voice είναι ήδη το δεύτερο μεγαλύτερο γνωστό δημόσιο φωνητικό σύνολο δεδομένων, καθώς άνθρωποι σε όλο τον κόσμο προσθέτουν σταδιακά και τη δική τους φωνή (σε πρώτη φάση μόνο στα αγγλικά).

Με τη δημιουργία του νέου δημόσιου συνόλου δεδομένων, το Mozilla Foundation συμβάλλει να ξεπερασθούν τα εμπόδια και να διευκολυνθεί η ανάπτυξη καλύτερων συστημάτων αναγνώρισης ομιλίας. Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική.

Μπορεί κανείς να «κατεβάσει» με ελεύθερη άδεια «κοινού κτήματος» την πρώτη έκδοση της φωνητικής συλλογής Common Voice στη διεύθυνση: https://voice.mozilla.org/data. 

ΣΧΟΛΙΑ (2)

Την αδεια των ομιλουντων την ζητησαν;

Λεμε τωρα, γιατι και κατι για microsoft cortanes ακουσαμε ... Χαλασε και το firefox , ανεξαρτητο ελεγε, αδεσμευτο ελεγε, τωρα ξερουμε οτι αμοιβεται απο τη google για να την εχει πρωτη μηχανη αναζητησης. Και κατι για συλλογη δεδομενων βλεπω στα μενου του firefox τελευταια, λετε να μικροσοφτιασει κι αυτος;

Lakis

Ξαναδιάβασε το άρθρο ζώο!!!!

ΠΡΟΣΘΗΚΗ ΣΧΟΛΙΟΥ
Απομένουν χαρακτήρες
* Υποχρεωτικά πεδία

Δείτε Επίσης

kipman

Ο μηχανικός λογισμικού Άλεξ Κίπμαν εξηγεί στο protothema.gr πώς τα έξυπνα γυαλιά μεικτής πραγματικότητας που δημιούργησε συνδυάζουν τον ψηφιακό και τον πραγματικό κόσμο - «Από την επιστημονική φαντασία περάσαμε στην επιστημονική πραγματικότητα»

3
bayer_main01

Με την ευκαιρία της πρόσφατης εξαγοράς της Monsanto από τη Bayer, o Διευθύνων Σύμβουλος της Bayer Ελλάς Dr. Joao Barroca εξηγεί πως αυτή θα επηρεάσει την ελληνική αγορά, αλλά και ποιο είναι το όραμα του γερμανικού κολοσσού για την αειφορία στη γεωργία.