* Απλό κείμενο: Η πιο συνηθισμένη μορφή, που περιέχει μόνο χαρακτήρες και στίξη.
* μορφοποιημένο κείμενο: Περιλαμβάνει στοιχεία μορφοποίησης όπως Bold, πλάγια πλάτη και διαλείμματα γραμμής.
* Φωνικές μεταγραφές: Χρησιμοποιώντας φωνητικά σύμβολα για να αντιπροσωπεύετε τους ήχους του κειμένου.
* Προσωπικές πληροφορίες: Πρόσθετες πληροφορίες σχετικά με τον ρυθμό, τον τόνο και την έμφαση του κειμένου.
Πέρα από το κείμενο, ορισμένοι συνθέτες ομιλίας μπορούν να δεχθούν πρόσθετες εισόδους:
* Παράμετροι φωνής: Επιτρέποντας στους χρήστες να προσαρμόσουν τη συνθετική φωνή, όπως το φύλο, την ηλικία, την προφορά και τον συναισθηματικό τόνο.
* Σήματα ήχου: Για εφαρμογές όπως η μετατροπή φωνής σε πραγματικό χρόνο, όπου ο συνθέτης τροποποιεί ένα υπάρχον ηχητικό σήμα.
Ο τρόπος με τον οποίο ο συνθέτης επεξεργάζεται αυτές τις εισόδους μπορεί να ποικίλει σε μεγάλο βαθμό, που κυμαίνονται από απλά συστήματα που βασίζονται σε κανόνες έως σύνθετα μοντέλα βαθιάς μάθησης. Ωστόσο, η βασική αρχή παραμένει η ίδια: μετατρέποντας το κείμενο σε σήματα ομιλίας.
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα