Προγραμματισμός

Γνώση Υπολογιστών >> Προγραμματισμός >  >> Προγραμματισμός Υπολογιστών Γλώσσες

Χρησιμοποιώντας τα eBCDIC ADCII και τον κωδικό χαρακτήρων Unicode, τι είναι οι δυαδικές κωδικοποιήσεις του μηνύματος Hello World;

Ας σπάσουμε τις δυαδικές κωδικοποιήσεις του "Hello World" σε EBCDIC, ASCII και Unicode:

1. EBCDIC (εκτεταμένη δυαδική κωδικοποιημένη δεκαδική ανταλλαγή κώδικα)

* Το EBCDIC χρησιμοποιεί έναν κωδικό 8-bit, δίνοντάς του 256 πιθανούς χαρακτήρες.

* Χρησιμοποιείται κυρίως στα συστήματα MainFrame IBM.

Δυαδική κωδικοποίηση του "Hello World" στο EBCDIC:

`` `

H - 11000100

Ε - 11000101

L - 11001100

L - 11001100

o - 11011111

- 01000000 (χώρος)

W - 11101101

o - 11011111

R - 11100010

L - 11001100

D - 11001001

`` `

2. ASCII (αμερικανικός πρότυπος κωδικός για ανταλλαγή πληροφοριών)

* Το ASCII χρησιμοποιεί έναν κώδικα 7-bit (επεκτείνεται σε 8-bit σε ορισμένες περιπτώσεις), δίνοντάς του 128 (ή 256) πιθανούς χαρακτήρες.

* Χρησιμοποιείται ευρέως σε υπολογιστές και στο Διαδίκτυο.

Δυαδική κωδικοποίηση του "Hello World" στο ASCII:

`` `

H - 01001000

E - 01100101

L - 01101100

L - 01101100

O - 0110111111111111111111ρε

- 00100000 (χώρος)

W - 01010111

O - 0110111111111111111111ρε

r - 01110010

L - 01101100

D - 01100100

`` `

3. Unicode (σύνολο καθολικών χαρακτήρων)

* Το Unicode χρησιμοποιεί κωδικοποίηση μεταβλητού μήκους, επιτρέποντας μια μεγάλη ποικιλία χαρακτήρων από διαφορετικές γλώσσες.

* Η πιο συνηθισμένη κωδικοποίηση είναι το UTF-8, η οποία είναι μια κωδικοποίηση μεταβλητού μήκους που χρησιμοποιεί 1-4 bytes ανά χαρακτήρα.

Δυαδική κωδικοποίηση του "Hello World" στο UTF-8 (Unicode):

`` `

H - 01001000

E - 01100101

L - 01101100

L - 01101100

O - 0110111111111111111111ρε

- 00100000 (χώρος)

W - 01010111

O - 0110111111111111111111ρε

r - 01110010

L - 01101100

D - 01100100

`` `

Σημαντικές σημειώσεις:

* Η δυαδική κωδικοποίηση ενός χαρακτήρα μπορεί να ποικίλει ελαφρώς ανάλογα με το συγκεκριμένο σχήμα κωδικοποίησης που χρησιμοποιείται σε ένα δεδομένο σύστημα (π.χ. ASCII-7, ASCII-8, UTF-16 κ.λπ.).

* Η κωδικοποίηση του παραδείγματος UTF-8 χρησιμοποιεί τα ίδια bytes με το ASCII, δεδομένου ότι το UTF-8 είναι συμβατό με ASCII για χαρακτήρες εντός της περιοχής ASCII.

Επιτρέψτε μου να ξέρω αν θέλετε μια πιο λεπτομερή εξήγηση για οποιοδήποτε συγκεκριμένο σχέδιο κωδικοποίησης ή να έχετε άλλο κείμενο που θέλετε να δείτε κωδικοποιημένο!

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα